人工智能---课设
偶耶耶 2024-06-16 09:01:02 阅读 89
题目
利用 SVM 将图中给定 5 类数据分为 3 类,并在原图中画出 3 类别分类曲线,然后再计算分类器精度。 其中分类器按照 85-15%总体数据进行学习和测试,用模糊矩阵表示分类结论并对分类结果进行说明。
第一题: 提取数据+绘图
查找资料解决如何读取 fig 文件中数据,并按照自己的理解方式重新制 作 MATLAB 图形。
重新绘制图形如下:
从fig文件提取数据代码如下:
% 打开.fig文件并获取图形句柄figure_handle = open('Fig_DataSetM.fig');% 获取当前轴上的所有子图形对象children = get(gca, 'Children');% 初始化一个新的图形窗口figure;% 设置颜色映射和符号colors = lines(length(children)); % 使用 lines 而不是 jetmarkers = ['o', 'x', '+', '*', 's', 'd', 'v', 'p', 'h', '.'];% 初始化空数组用于存储数据data = [];% 遍历所有子图形对象for i = 1:length(children) % 获取子图形对象的句柄 child = children(i); % 为每个类别选择一个符号 marker = markers(mod(i-1, length(markers)) + 1); % 检查子图形对象是否为一个组 if strcmp(get(child, 'Type'), 'hggroup') % 获取组内的所有子图形对象 grand_children = get(child, 'Children'); % 遍历组内的所有子图形对象 for j = 1:length(grand_children) grand_child = grand_children(j); % 获取数据并画散点图,为每个类别设置一种颜色和一个符号 x_data = get(grand_child, 'XData'); y_data = get(grand_child, 'YData'); scatter(x_data, y_data, [], colors(i,:), marker); hold on; % 保持当前图形 % 将数据添加到数组中 data = [data; [x_data(:), y_data(:), repmat(i, length(x_data), 1)]]; end else % 获取数据并画散点图,为每个类别设置一种颜色和一个符号 x_data = get(child, 'XData'); y_data = get(child, 'YData'); scatter(x_data, y_data, 'MarkerEdgeColor', colors(i,:), 'Marker', marker); % 不使用 'filled',而是指定边缘颜色 hold on; % 保持当前图形 % 将数据添加到数组中 data = [data; [x_data(:), y_data(:), repmat(i, length(x_data), 1)]];%读出数据为data00.csv文件data = [data];filename = 'data00.csv';writematrix(data, filename);
重新画MATLAB图代码如下:
% 读取数据文件data = readmatrix('data00.csv');% 将数据按标签分组label1 = data(data(:,end)==1,:);label2 = data(data(:,end)==2,:);label3 = data(data(:,end)==3,:);label4 = data(data(:,end)==4,:);label5 = data(data(:,end)==5,:);% 绘制散点图scatter(label1(:,1),label1(:,2));hold on;scatter(label2(:,1),label2(:,2));scatter(label3(:,1),label3(:,2));scatter(label4(:,1),label4(:,2));scatter(label5(:,1),label5(:,2));hold off;% 添加图例legend('Class 1','Class 2','Class 3','Class 4','Class 5');
第二题:SVM实现多分类
分类图如下:
分类图代码如下:
% 读取数据文件data = readmatrix('data00.csv');% 将数据按标签分组label1 = data(data(:,end)==1,:);label2 = data(data(:,end)==2,:);label4 = data(data(:,end)==4,:);label3 = data(data(:,end)==3,:);label5 = data(data(:,end)==5,:);% 将第一类、第二类和第四类数据合并为一类label124 = [label1; label2; label4];% 将数据标签合并为 3 类group = zeros(size(data,1),1);group(ismember(data(:,end),[1,2,4])) = 1; % 第一类、第二类和第四类为第一类别group(data(:,end)==3) = 2; % 第三类为第二类别group(data(:,end)==5) = 3; % 第五类为第三类别% 划分训练集和测试集[trainInd,valInd,testInd] = dividerand(size(data,1),0.85,0,0.15);trainData = data(trainInd,:);trainGroup = group(trainInd,:);testData = data(testInd,:);testGroup = group(testInd,:);% 训练 SVM 模型svmMdl = fitcecoc(trainData(:,1:end-1),trainGroup);% 在测试集上进行预测testPred = predict(svmMdl,testData(:,1:end-1));% 计算准确率acc = sum(testPred == testGroup)/length(testGroup);% 绘制散点图和分类曲线figure();hold on;gscatter(data(:,1),data(:,2),group);
第三题:实现多分类结果表示并计算出分类精度
混淆矩阵如下:
代码如下:
% 绘制混淆矩阵图plotconfusion(categorical(testGroup),categorical(testPred));% 计算混淆矩阵confMat = confusionmat(testGroup,testPred);% 计算分类精度acc = sum(diag(confMat))/sum(confMat(:));分类精度 = 1
第四题:利用 GMM 学习算法实现以上分类效果
波峰图如下:
代码如下:
% 读取数据文件data = readmatrix('data00.csv');% 将数据按标签分组label1 = data(data(:,end)==1,:);label2 = data(data(:,end)==2,:);label4 = data(data(:,end)==4,:);label3 = data(data(:,end)==3,:);label5 = data(data(:,end)==5,:);% 将第一类、第二类和第四类数据合并为一类label124 = [label1; label2; label4];% 将数据标签合并为 3 类group = zeros(size(data,1),1);group(ismember(data(:,end),[1,2,4])) = 1; % 第一类、第二类和第四类为第一类别group(data(:,end)==3) = 2; % 第三类为第二类别group(data(:,end)==5) = 3; % 第五类为第三类别% 划分训练集和测试集[trainInd,valInd,testInd] = dividerand(size(data,1),0.85,0,0.15);trainData = data(trainInd,:);trainGroup = group(trainInd,:);testData = data(testInd,:);testGroup = group(testInd,:);% 使用GMM学习算法进行分类options = statset('MaxIter',500);gmmMdl = fitgmdist(trainData(:,1:end-1),3,'CovarianceType','full','Options',options);gmmPred = cluster(gmmMdl,testData(:,1:end-1));% 计算分类精度acc = sum(gmmPred == testGroup)/length(testGroup);% 绘制散点图和分类曲线figure();hold on;gscatter(data(:,1),data(:,2),group);% 绘制GMM分布M = 70;X = linspace(min(data(:,1)), max(data(:,1)), M);Y = linspace(min(data(:,2)), max(data(:,2)), M);[X,Y] = meshgrid(X, Y);points = [X(:), Y(:)];gmPDF = pdf(gmmMdl, points);Z1 = reshape(gmPDF, M, M)';figure;surf(X, Y, Z1);view(-39,34);set(gca,'FontSize',14);xlabel('Feature 1');ylabel('Feature 2');zlabel('PDF');title('GMM PDF')% 绘制3D波峰图和分类曲线figure();hold on;[xx, yy] = meshgrid(min(data(:,1)):0.01:max(data(:,1)),min(data(:,2)):0.01:max(data(:,2)));zz = zeros(size(xx));for i=1:size(xx, 1) for j=1:size(xx, 2) zz(i, j) = pdf(gmmMdl, [xx(i, j), yy(i, j)]); endendmesh(xx, yy, zz);gscatter(data(:,1),data(:,2),group);
结论: 对比两种算法的结果,我们可以看到SVM的分类精度为1,也就是说它可以完美地将数据集分为不同的类别。相比之下, GMM的分类精度只有0.3991,说明它在某些情况下进行分类时会出现错误。因此,在实际应用中,SVM更容易被应用于分类问题, 特别是对于需要高度准确性的任务,如医学图像识别等。只有在某些不需要非常高的准确性的场景下,GMM才会被优先考虑。
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。