圆同学2022-07-08 15:53:04
第2项和第3项说是把数字和符号都去掉,我就很不明白了,数字那么简单的东西,非常适合机器学习,想想二进制,对吧??为什么要删掉呢?数字化时代,数字这么重要,数字都是重要的资产啦、现金流了,怎么又把数字去掉了?哎,崩溃,不知道在说什么。
回答(1)
Essie2022-07-08 18:53:58
你好,在分析结构化数据时,数字确实意义重大,像你说的资产,现金流这类,假设我们分析的是公司的财务报表,这属于结构化数据,数字就是研究的对象,当然不能删除。
但是这里主要讨论的是非结构化数据关于文本分析的方法,所以更关注文本本身,比如说一篇新闻或报告中,机器学习想通过对文本的分析来了解市场的投资情绪,那么就要将原文中的数字和一些特殊符号删除。如果对于特定文本,数字在其中占据显著的意义,那么可以使用/number/来代替数据本身。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片