啦同学2020-03-18 15:29:20
老师第五题 为什么是extraction? 题目里面不是建立了新的指标吗?比如int coverage ratio 几个数加加减减在一起么 第七题,说去掉标点符号是错的?? 答案竟然解释不是去掉所有的标点符号。那到底算去掉标点符号还是不去掉啊? 第八题 第二步不是在做标准化么??
回答(1)
最佳
Vincent2020-03-19 18:31:10
同学你好,
5: aggregation是将两个或多个相似的变量合并,比如salary和other income合成total income
这里的都属于基于现有的变量创造出新的变量。把IPO date变成Age,把EBIT/inteest创出interest coverage ratio.
7: 不是去掉所有的punctation和number, 有些会保留下来,这里算法会决定保留哪些。
保留的时候会把数字转成/number/,把百分号转成percentsign, 所以原文中4%,就变成/number/ percentsign.
8. 第三步是标准化,第二步在先要把句子拆成词。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片