科技 > 星环科技创始人孙元浩 大模型在特定领域只是本科生级别

星环科技创始人孙元浩 大模型在特定领域只是本科生级别

2023-05-28 14:46阅读(63)

5月26日,星环科技创始人孙元浩在接受采访时谈到,特定领域中大模型并不能像一个专家一样去解答一些问题,目前大模型只能相当于一个本科生或者是比本科生低一年

1

5月26日,星环科技创始人孙元浩在接受采访时谈到,特定领域中大模型并不能像一个专家一样去解答一些问题,目前大模型只能相当于一个本科生或者是比本科生低一年级的水平,只能够作为一个实习生或者专业的知识库去解答问题,但是对于行业深度的知识内容是无法做出解答,这样的限制条件让他没办法去解决一些特定行业的业务问题,之所以出现这种情况,主要是面临着三大限制问题。

第一个限制就是大模型的训练是需要一定的时间,并且在训练期间方面有着较强的时间限制,很有可能需要达到半年或一年的训练时间,但是在训练之后,各种资讯市场行情以及时事新闻等板块,都是会发生一系列的变化,他们的这些变化又无法去提前预装到大模型中,这样就需要一个外部的机制和存储模块去存放实时的信息,这样或许是能够在训练完成之后及时导入相关信息,从而先前训练的信息都是做出更新。

第二点就是在大模型这个行业中,无论是通用大模型还是行业大模型,在信息输入方面都是具备一定的限制,这个限制取决于大模型的算力以及工程化的难度级别,根据一般的情况来看,大模型的输入是具有着多种字符的设置,比如chat GPT第三代的输入限制是4096个标符,相当于1024个汉字数量,第四代的大模型大概可以输入24000多个汉字,这样的限制就意味着,如果一个公司的年报放进去,就很有可能会超过字体数量的限制,不能够对这些数据完成分析。

第三点则是部分大模型的精准度出现差异化,这种情况会导致在提供数据的时候容易出现幻觉,所以就需要一个知识库来校正大模型给出的数据结果,需要一个完善的机制来补充大模型的相关数据,这样才能够确保大模型给出的数据变得更加准确,能够给人们提供最实时的信息资源,向数据库提供中间存储的板块,这个板块的基本功能就是将非结构化的数据转向成高维向化的数据,从而给用户提供进一步的搜索能力。

相关问答推荐