iptc网站开发工程师asp考试试题答案c# 网站开发实例教程
iptc网站开发工程师asp考试试题答案,c# 网站开发实例教程,网站分销系统,seo检测优化知识点复盘#xff1a;
字典的简单介绍#xff08;增删查改#xff09;标签编码#xff08;字典的映射#xff09;对独热编码的深入理解----n个不相关变量只有n-1个自由的连续特征的处理#xff1a;归一化和标准化----一般选一个即可#xff0c;谁好谁坏做了才知道字典的简单介绍增删查改标签编码字典的映射对独热编码的深入理解----n个不相关变量只有n-1个自由的连续特征的处理归一化和标准化----一般选一个即可谁好谁坏做了才知道除非有先验知识。至此常见的预处理方式都说完了作业对心脏病数据集的特征用上述知识完成一次性用所有的处理方式完成预处理包括缺失值的处理离散特征的编码连续特征的归一化or标准化数据可视化单特征、单特征与标签import pandas as pd data pd.read_csv(rD:\课程\课程文件1\pythonstudy\pythonx训练营\python-60days-challenge\heart.csv) data.head()输出缺失值的处理data.isnull()输出data.head()输出离散特征的编码data.columns输出print(data.dtypes)输出for discrete_features in data.columns: if data[discrete_features].dtype object: print(discrete_features)data[age]data[age].value_counts()整合连续特征的归一化or标准化数据可视化单特征、单特征与标签# 手动实现归一化 def manual_normalize(data): min_val data.min() max_val data.max() normalized_data (data - min_val) / (max_val - min_val) return normalized_data data[sex] manual_normalize(data[sex]) data[sex].head()输出0 1.0 1 1.0 2 0.0 3 1.0 4 0.0 Name: sex, dtype: float64# 使用sklearn进行归一化处理 from sklearn.preprocessing import StandardScaler, MinMaxScaler data pd.read_csv(rD:\课程\课程文件1\pythonstudy\pythonx训练营\python-60days-challenge\heart.csv) min_max_scaler MinMaxScaler() data[sex] min_max_scaler.fit_transform(data[[sex]]) data[sex].head输出bound method NDFrame.head of 0 1.0 1 1.0 2 0.0 3 1.0 4 0.0 ... 298 0.0 299 1.0 300 1.0 301 1.0 302 0.0 Name: sex, Length: 303, dtype: float64# 使用sklearn进行标准化处理 data pd.read_csv(rD:\课程\课程文件1\pythonstudy\pythonx训练营\python-60days-challenge\heart.csv) scaler StandardScaler() data[sex] scaler.fit_transform(data[[sex]]) data[sex].head()输出0 0.681005 1 0.681005 2 -1.468418 3 0.681005 4 -1.468418 Name: sex, dtype: float64数据可视化单特征单特征与标签的关系plt.figure(figsize(12, 6)) sns.violinplot(xage, ychol, datadata, scalewidth, innerquartile)#把年龄age当横轴分组胆固醇chol当纵轴连续量画“小提琴”——左右鼓包表示每个年龄组里 chol 的分布形状宽度代表样本量。 plt.title(Cholesterol vs. age) plt.xlabel(Age (years)) plt.ylabel(Cholesterol (mg/dL)) plt.tight_layout() plt.show()输出import seaborn as sns import matplotlib.pyplot as plt plt.figure(figsize(8, 5)) # 1. 只画 KDE 轮廓填不填都可以 sns.kdeplot(datadata, xchol, huetarget, fillTrue, # 填色更直观 bw_adjust0.7, # 平滑度 common_normFalse,# 各自积分1方便比较形状 paletteSet2) # 2. 细节美化 plt.title(Cholesterol distribution by Heart Disease) plt.xlabel(Cholesterol (mg/dL)) plt.ylabel(Density) plt.legend(titleHeart Disease, labels[No, Yes]) plt.tight_layout() plt.show()输出浙大疏锦行