网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
04月19日
漏签
0
天
机器学习吧
关注:
22,076
贴子:
39,696
看贴
图片
吧主推荐
游戏
19
回复贴,共
1
页
<<返回机器学习吧
>0< 加载中...
请问为什么对所有数据做一次PCA降维以后,再用这些数据划分训
只看楼主
收藏
回复
3424wdadff
中级粉丝
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请问为什么对所有数据做一次PCA降维以后,再用这些数据划分训练集和测试集,得到的模型精度很好,但是导师说这样做不对,是偷看了先验信息,这是为什么呢,请大神解答!
我真不打游戏-
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
你用测试集的东西去做降维就不对
pyyinhefeng
知名人士
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
要先把数据分成训练集和测试集,然后在训练集上进行PCA
涤生
中级粉丝
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
你训练的时候不应该知道测试数据的性质的吧?一起训练就等于你训练的时候利用了测试数据的信息。
涤生
中级粉丝
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
楼主对这个懂了吗,我有些问题想咨询
Smart_stone666
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
个人觉得测试集好像是一份考卷,在训练时要假设无法获取考卷内内容的任何信息,统计数据分布,统计缺失值占比都不行。
清风明月一路来
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
我也遇到这个问题,请问解决了吗?,按照这样说,是不是要测试集单独pca,然后再进行测试?还是怎么的?着急解决
游梦迷途
知名人士
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
经验加3
卷积卷
中级粉丝
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
先分training set和test set,然后所有的训练都要基于training set
游梦迷途
知名人士
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
经验加三,告辞!
绿岛小微米
铁杆吧友
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
pca有个transfom,就是用来对测试集用的
随影而飘影相随
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
PCA降维后能跟新字典吗?比如刚开始 字典是100个数据,然后后面每测试一个数据,把这个数据替换原字典里面最不合适那个数据,怎么解决?
吻妳好甜
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
数据首先分成训练集、测试集;对训练集进行PCA,将拟合之后获得的特征向量矩阵用在测试集上去;
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示