1034 注意:在未使用cache的情况下,可以直接使用pca1访问实例。使用cache后必须使用ponents_ 1037 跟pipe差不多,可以与pipe公用创建更佳的管道 1053 4.2.2。特征哈希 特征哈希,相当于一种降维技巧
1060 4.2.3.3。常见的矢量化,使用 将文本转换为每个词出现的个数的向量 1064 min_df:最小的词频,过滤出现次数少的词汇 1114 4.2.3.8。矢量化大型文本语料库与哈希的把戏 1125
4.3.1。标准化,或均值去除和方差缩放 1179 4.6.1。对于核近似奈斯特龙的方法 1187 4.7。成对度量、亲和度和核 1214 5。数据加载工具 1227
5.6。来自外部数据集的加载 1232 5.8.3。过滤文本以获得更真实的训练 1234 5.10。人脸识别数据集中的标记人脸 1241 5.14。乳腺癌威斯康星(诊断)数据库 1246
5.16。手写数字数据集的光学识别 1255 6。规模计算策略:更大的数据 1256 6.1。使用核心学习的实例扩展
如果一个小数的小数部分乘4,原来的小数就变成3.4;如果这个小数的小数部分乖乘7,原来的小数就变成5.2.原来的小数是多少?