贝叶斯优化最近邻分类matlab代码
数据为Excel分类数据集数据。
数据集划分为训练集、验证集、测试集,比例为8:1:1
数据处理:代码对数据进行了规范化处理,包括标准化和数据集划分,使得数据具有一致的尺度和格式,有利于算法的训练和测试。
算法选择:代码选择了适当的算法进行分类任务,通过贝叶斯迭代和十折交叉验证等方法进行模型训练和评估,提高了模型的泛化能力。
结果展示:代码在最后通过绘图的方式展示了分类结果和混淆矩阵,直观地展示了模型的性能和分类效果,有助于对模型进行评估和改进。
输出的定量结果如下:
十折验证准确率:0.95935
训练集准确率:0.95935
验证集准确率:1
测试集准确率:0.93333
运行时长: 3.484
代码有详细中文介绍。
代码运行结果图如下:
部分代码如下:
% 清除命令窗口、工作区数据、图形窗口、警告
clc;
clear;
close all;
warning off;
load('data.mat') % 加载数据
data1 = readtable('分类数据集.xlsx'); % 读取数据
data2 = data1(:, 2:end);
data = table2array(data1(:, 2:end));
data_biao = data2.Properties.VariableNames; % 数据特征的名称
A_data1 = data;
data_biao1 = data_biao;
data_select = A_data1;
feature_need_last = 1:size(A_data1, 2) - 1;
%% 数据划分
x_feature_label = data_select(:, 1:end-1); % x特征
y_feature_label = data_select(:, end); % y标签
index_label1 = randperm(size(x_feature_label, 1));
index_label = G_out_data.spilt_label_data; % 数据索引
if isempty(index_label)
index_label = index_label1;
end
spilt_ri = G_out_data.spilt_rio; % 划分比例 训练集:验证集:测试集
train_num = round(spilt_ri(1)/(sum(spilt_ri))*size(x_feature_label, 1)); % 训练集个数
vaild_num = round((spilt_ri(1)+spilt_ri(2))/(sum(spilt_ri))*size(x_feature_label, 1)); % 验证集个数
% 训练集,验证集,测试集
train_x_feature_label = x_feature_label(index_label(1:train_num), :);
train_y_feature_label = y_feature_label(index_label(1:train_num), :);
vaild_x_feature_label = x_feature_label(index_label(train_num+1:vaild_num), :);
vaild_y_feature_label = y_feature_label(index_label(train_num+1:vaild_num), :);
test_x_feature_label = x_feature_label(index_label(vaild_num+1:end), :);
test_y_feature_label = y_feature_label(index_label(vaild_num+1:end), :);