对话IDEA张家兴：AI离成为普通人的工具就差一步

对话IDEA张家兴：AI距离成为普通人的工具仅一步之遥｜36氪独家专访

对话IDEA张家兴：AI离成为普通人的工具就差一步｜36氪专访

文字|林伟新

编辑｜唐艳

ChatGPT引起了响亮的共鸣，大洋两岸的AI产业为之震动。短短几个月，众多知名人士纷纷宣布致力于大规模模式创业。即使有些人距离人工智能还很远，对大型模型知之甚少，但他们仍然愿意花费非凡的热情和金钱。一步步走上这条路。

“我们仿佛又回到了10年前深度学习刚提出的时候。”张家兴告诉36氪。“整个社会、社会各阶层都在积极接受新技术。”

近日，36氪对这位科学家企业家进行了专访。他承认这是他职业生涯中最激动人心的阶段。“我真实地经历了深度学习技术从学术界兴起到工业界应用的整个周期。现在我觉得我正在经历深度学习的第二阶段，即技术周期。”

张家兴，粤港澳大湾区数字经济研究院（IDEA研究院）首席科学家、认知计算与自然语言研究中心主任。在加入IDEA研究院之前，他曾就职于百度、阿里巴巴、360等大型公司，带领团队进行人工智能相关项目研究和技术实施。

两年前，张家兴加入IDEA研究院，开始带领团队对大型模型进行深入研究。他是国内最早专注于预训练大型模型的团队之一。他带领团队开源了中国第一个基于人工智能的绘画模型“太乙”，还创建了名为“封神榜”的大型模型开源项目。到目前为止，已经开源了100多个模型。

作为行业专家，张家兴第一时间注意到了ChatGPT的发布。他坦言，一开始他低估了GPT-3.5带来的技术突破，直到团队开始体验它，他心里“非常惊讶”。

在他看来，颠覆性的改变在于从过去注重模式结构创新转向注重培养方式创新。OpenAI为国内外合作伙伴指明了一条清晰的路径：把大型通用模型当成产品，引入更先进的训练方法，对模型进行一遍又一遍的打磨和调试。因此，培训方式将成为大型模型厂商的核心竞争优势。

对于张家兴来说，开展大规模建模业务最困难的不是资金和算力，而是人才。这不是光靠钱就能解决的事情。在中国，AI学术界与产业界存在一定脱节，学术界产生的前沿成果往往难以快速应用于产业界。“在年轻的研究人员和工程师中，过去每个人都忽视的一层是那些利用工程技能创建模型的人。”

未来，社会各阶层都需要大型车型——这已经是一个显着的发展趋势。如今，许多公司仍然使用API来构建大型通用模型，但并非所有公司都有能力和资源从头开始构建大型模型。“只有每个公司都有自己的大模型，才能构建封闭的模型场景，商业实践才能成功。我想在中国完成这一层能力，创造影响力。”张家兴说。

目前，张家兴的团队也在践行这条道路——专注于垂直领域的大型模型制作，与各行业的企业客户合作，帮助客户定制合适的模型并应用于特定的应用场景。

对于人工智能发展的未来，张家兴非常乐观，认为人工智能可以帮助提高人类数字生产力。未来十年属于生成人工智能和通用人工智能。对于外行来说，学习如何使用AI工具并不难。

张家兴

以下是36氪与张家兴的对话，由36氪编辑整理：

OpenAI强调大型模型的价值

36氪：2014年您在深度学习领域其实就发表了相当前沿的研究成果，您当时有没有想到会出现ChatGPT这样的产品？

张家兴：2014年，有一个技术叫LSTM（长短期记忆网络），在学术界产生了惊人的成果。当时给我印象比较深刻的一个例子就是能够直接生成网页代码，格式确实正确，而且网页也能显示。所以我们今天看到的生成式人工智能实际上是在2014年就开始发展的，只是还没有在工业上得到应用。一个很重要的原因就是当时的模型规模太小，无法与今天相比。现在技术已经准备好了，有了更多更好的数据和计算能力，我们希望的生成模型终于成为现实。

36氪：两年前您在IDEA研究院开始对大型模型进行深入研究。当时你对大模特的评价是怎样的？学术界对大型模型的研究估计状况如何？

张家兴：我一直看好人工智能的发展。两年前，随着GPT3的到来，我们意识到认知智能的未来必须基于基础设施——预先训练的模型。要执行任何自然语言任务，您需要从预先训练的模型开始。不可能一切都从头开始，从头开始。

当时，我成立了认知计算和自然语言研究中心来生产预训练模型。和现在不同的是，当时的模型结构还没有像今天这样和GPT这样的结构融合在一起，那时候还是百花齐放。

3636氪：你们创建了什么样的预训练模型？

张家兴：当时我们团队推出了《封神榜》系统。“系统”这个词也意味着我们要做很多基础的训练模型。当时我们是中国最大的开源系统。我们希望下游用户能够使用我们的模型，并进一步完善它以实现适合其特定场景的应用。这个工作历时两年，开源了近百个预训练模型，直到ChatGPT的出现，传统模型的影响力才被打断。

36氪：从技术角度来说，ChatGPT最让你惊讶或者吃惊的是什么？

张家兴：让我惊讶的是，他能够根据一定的知识进行复杂的推理，得出正确的结论。

之前我们有两个大问题很难解决。其中之一是知识结构化，耗时长、准确性难以保证、维护成本高。现在，只要预先训练包含知识的文本，大型模型就可以真正理解和记住知识。

另一个是推理。以前，我们认为推理只能通过符号系统和结构化知识来实现??。目前我们看到ChatGPT可以完全通过自然语言进行训练，而符号和知识尚未被证明具有这种能力。这破坏了我们对这个问题的理解。

36氪：具体来说，OpenAI推动的最重要的技术变革是什么？

张家兴：最后，我们从过分注重模式结构创新转向注重训练方法创新。训练方法变得更加重要。

ChatGPT4模型与两年前的GPT3模型结构相同，但为何影响力却增长如此之大？随着更先进的训练方法被引入，例如自定义调整，使机器能够更好地理解人类指令；比如人类反馈学习，可以调整模型的偏好，都是训练方法的创新。

我们的团队目前正在将这种创新的训练方法应用到模型训练过程中。实际应用证明该方法确实可以显着提高模型性能。因此，我们深刻认识到训练方法的创新对于实现更强大的人工智能系统具有重要作用。虽然模型结构是开源的，但训练方法才是你隐藏的核心竞争力，这也使得通用模型训练在这个时代具有商业价值。

同时，OpenAI也让大家意识到，我们不应该只通过一次训练来追求一个好的模型。模型效果的提升依赖于反复打磨、不断迭代改进。

36氪：这是否意味着把模型当作产品来对待？

张家兴：是的，当我的模型经过训练迭代时，我会看看模型的优点和缺点。对于缺点，我会想办法改进，然后继续训练。当所有的缺点都被弥补，优点都被强化之后，这个模型就变成了今天大家看到的样子。我们团队正在制作的大型姜子牙模型作为产品正在不断完善，未来也会不断完善。

36氪：OpenAI刚起步时，因为其技术路径比较小众，创始人SamAltman回忆说，他们受到了很多关注。您刚开始做IDEA的时候，当时国内的行业氛围是怎样的？

张家兴：当时这个领域（预训练的大模型）并没有受到太多关注，因为大家的传统思维是AI的价值应该和具体的行业结合起来，应该直接在行业中应用。在某些情况下。我们只生产预训练的模型，其他人可能不理解并认为通用的东西有什么用？

但ChatGPT的出现让大家知道，创建通用模型的公司在整个行业生态系统中具有巨大的价值。AI行业需要一个上下游这样的生态系统，而不是每个公司都建立自己的垂直烟囱——从预训练的模型到产业实施，构建整个系统是很诱人的。

OpenAI已经证实了大模型的价值，我们所做的事情的价值也终于得到了证实。

36氪：现阶段还值得追求OpenAI，打造类似ChatGPT的东西吗？

张家兴：还是有道理的。OpenAI提供了超大规模的模型和通用的API，期待大家调用。这并不是实施这个行业的唯一方式。很多商业公司需要针对自己的场景定制模型，但又无法从头开始。成本太高，因此他们需要一家生产大型通用模型的公司来帮助他们。

36氪：你们团队会这么做吗？

张家兴：我们有能力制作大型通用模型，同时我们也可以给用户提供一些工具，帮助用户基于我们的模型不断制作出自己垂直应用场景的模型。这样就可以创建用户模型和场景。重复。我认为这是下一个大模型商业成功的关键。

模型的提出是商业化的关键

36氪：最近你的工作肯定很忙，能告诉我们你这一天过得怎么样吗？

张家兴：我的一天就是和团队一起研究我们正在研究和讨论最前沿的技术问题。另一方面，我们现在跟大量的客户见面，主要是听听他们想要用大模型做什么，这样我们的通用模型就可以提供大家需要的能力。

例如，我们未来会使用不同能力侧重点的开源模型，因为我们发现每个客户对大型模型的需求不同。通过这种开源模式，我们希望带动中国AGI应用层的热潮。

36氪：近两年来，开源系统“封神榜”已经推出了近百款开源车型。你们团队最近开源了具有130亿个参数的通用模型“姜子牙”。这个大模型实际上是什么样子的？

张家兴：《姜子牙》是我们针对大型通用模型推出的新开源系列，而第一个开源通用大型模型《姜子牙》也是我们封神榜开源系列中的第99个开源模型。

在最新的SuperCLUE评测榜单中，我们的姜子牙v-1评测成绩也排名第一。开源模型中的第1位。接下来，我们还将重点关注具有不同功能的不同开源模型，例如本周将推出的多式联运模型。

36氪：公司目前对大机型的需求是什么？

张家兴：我接触的公司几乎涵盖了所有领域。比较常见的有以下几种：第一个是生成文章和代码。二是对文本有真正开放、精准的理解，无需事先设定具体任务。第三个是推理，比如我想做一道题，你能给我一些怎么解题的建议吗？

36氪：大模型理想的商业模式应该是什么样的？

张家兴：根据以往的经验，很多商业成功都需要商业主体（比如企业、团队、机构等）基于技术产品建立应用场景，形成可重复的闭环。在这个闭环的生态系统中，更好的产品技术会吸引更多的用户和数据，产品和技术才能不断更新、变得更好。

但在AI行业，很多企业仍然笼统地调用大模型API，无法打造闭环，大模型商业化进程缓慢。只有每个企业都有自己的大模型，才能构建模型场景闭环，商业化实践才能成功。

我们团队的目标是用通用的大模型帮助每个公司甚至每个个人，让他们拥有并不断优化自己的大模型，与应用场景形成闭环，更好地走向商业化。

36氪：商业化将如何改变整个人工智能行业？

张家兴：未来的AI产业一定会成为一个大的生态系统。有各种下游公司在自己的场景中使用大型建模技术，也有上游模型制造商为整个生态系统提供预训练的模型。云供应商和解决方案公司在整个生态系统中也发挥着重要作用。

36氪：您有多年大型工厂技改业务实施经验，现在在IDEA研究院实践科研转化。从科研到转化，您有哪些经验想分享？

张家兴：作为一名科学家，你会更多地关注前沿技术和解决问题的创新，而较少关注这个技术如何给市场、社会带来价值，能够带来多少价值。。

作为一名科学家企业家，你需要更多地关注市场需求。从前沿的技术创新研究到终端市场商业化，有很多差距需要解决，包括了解市场、了解客户、了解实施的每一步。我相信每个科学家都有自己的梦想，而如何实现这些梦想是企业家必须要实现的目标。这也是一个让我现在特别兴奋的角色。

36氪：构建大模型有几个核心要素：算力、人才、数据等。从难到易，你会如何排列它们？

张家兴：我觉得最难的是人才。目前，在中国建造大型模型的团队仍然是稀缺资源。事实上，只要有资本和金钱的认可，算力就可以实现。虽然数据需要很长的时间积累，但数据是线性增长的，数据量有多大，投资就有多大。人才不是光靠金钱就能解决的，需要长时间的积累。通过生产近百个大型模型，我们的团队逐渐扩大。

36氪：目前，人工智能人才的竞争已经到了激烈的程度吗？

张家兴：也许有这样一个趋势。但从另一个方面来说，建立一个大的模型团队不仅仅是把人聚集在一起，还需要有一个好的方式来组织大家做出一个好的模型。

AI距离成为普通人类的工具仅一步之遥

36氪：目前人工智能研究的进展让您感到害怕吗？

张家兴：我一直看好人工智能对社会的影响。人工智能的发展虽然减少了一些就业机会，但也创造了更多的就业机会，而且它创造的就业机会甚至适合那些本来可能失业的人。

以我们算法工程师为例。以前，我们每个人都竖着建造烟囱，什么都做。现在AI行业拥有良好的上下游生态系统，算法工程师不可避免地会分为几个层次，有的工作在上游预训练模型上，有的工作在预训练模型上。基于上游提供的工具将模型付诸实践，并在下游更广泛地应用。下游对算法工程师的需求将会更大，从而导致AI创造更多的就业机会。

从宏观角度看，人工智能为社会创造更多数字生产力。今天，世界人口可能正在稳定甚至下降，但更好的生活需要更高的生产力。我们将普遍依靠人工智能来提高数字生产力。

36氪：今年3月，您公开表示未来10年将是生成式人工智能和通用人工智能的一部分。对于我们普通人来说，未来10年我们应该做哪些准备？

张家兴：对于普通人来说，需要学习如何使用AI工具，这对每个人都有用。另外，作为每个场景中的人，我必须努力思考如何在我的场景中积极利用AI技术，然后用AI增强我的场景。

36氪：不懂AI的人有可能被淘汰吗？

张家兴：未来，只要人类能够使用人工智能工具，就不会被淘汰。使用AI工具其实并不难。所以我希望大家积极使用AI，把它作为提高生产力的工具。

36氪：您认为我们现在已经进入AGI时代了吗？也许学术界还存在争论。

张家兴：我觉得叫AGI时代1.0。其实，你怎么理解“通用”这个词呢？现在终于有一个模型可以具备所有的能力，而且是通用的。

36氪：您认为AGI的下一个突破会是什么？

张家兴：AGI目前的特点是利用自然语言进行交互，但还缺乏自然语言学习的能力。如果未来AGI模型像人类一样，可以通过自然语言教授各种知识和技能，那么它们将真正成为普通人类的人工智能工具。未来，或许AGI可以像人类一样融入社会，与人类一起交流、学习、成长。

欢迎交流

免责声明：本文来源与互联网版权归作者所有，如有侵权请联系删除

上一篇：我国自主研发5G+AI铁路智慧机务系统投入使用 下一篇：谁在做高考志愿填报生意