止观团队进展与讨论

买点vs文本数据

大语言模型与知识图谱的打标/买点vs文本数据.md

买点vs文本数据

李欣妍解释他们和互联网公司收集的数据区别:互联网公司收集的是一个抽象信息,是用户的操作习惯,比如点击、滑动等操作数据。而他们收集的是具体的文本,比如日记、学修记录等。文本通过打标与知识库相连,形成知识网络。

相关主题:

大语言模型与知识图谱的打标


原文引用:

李欣妍[08:26:36]:因为你看你们埋点对吧?比如说这是一个网页,它有个确定按钮,然后你在确定按钮上埋点就可以看到有多少人点击了这个确定按钮。它收集的是个点击数据,还有就是说你怎么滑动它,然后你的这个网页上所有的操作都可以埋点。它收集的是你的用户的使用操作和使用习惯,它收集的其实是一个抽象的动作。

李欣妍[08:26:36]:我们收集的是每个人可能写一个日记,对吧?就今天干了什么,然后就写篇日记出来。然后呢,我们就自己去打标,比如说这一段我就描述的是我的学修记录,那就打一个学修记录标。然后你还可以索引,因为我们库里还有很多知识内容嘛,你就可以索引,今天学了这个知识,它就跟我们知识库里的那个知识连上了。