法作为服务提供,越来越多的初创公司正在开发自己的语言模型用于对话和分析,这不足为奇。到 2026 年,NLP 市场预计将增长到惊人的 351 亿美元。 2022 年对于大型语言模型来说是重要的一年。除了上面提到的商业选项之外,我们还有像Bloom这样的开源替代方案,它们完全能够实现类似的壮举,而且开源社区可以根据自己的心意对其进行调整。
NLP 的缺点 这些模型有意识吗?虽然少数人确实这么认为,但大多数工澳大利亚资源程师认为这些模型只是非常擅长像人一样说话,但它们几乎没有任何语义意识。换句话说,它们知道哪个词应该放在哪里,但它们不知道这些词是什么意思。 例如,让 Replika 描述红色,它会告诉你红色是温暖和快乐的。但是对于无法像我们一样体验温度的计算机来说,温暖意味着什么?对于硅基实体来说,快乐的体验是什么样的?这是 NLP 迄今为止的一大局限性。
正如我们常说的那样,模型的好坏取决于数据。盲目地将数十亿行的单词输入模型中,会招致偏见和不受约束的种族主义或其他形式的排斥。值得称赞的是,审查每一句话会非常困难,但其后果是,很容易将人工智能变成种族主义者或厌恶女性的人。 说到排除,目前 NLP 最大的问题是,除了英语和中文之外,大多数语言的模型都不够完善。我们没有西班牙语、葡萄牙语、法语、日语等语言的同等数量的数据。