在刚刚过去的2021年,中国人工智能行业最令人瞩目的事情,就是被誉为“AI四小龙”的商汤科技成功在港交所上市,成为“中国AI第一股”!
对于很多跑步的“AI创业者”来说,这无疑是一个振奋人心的消息——它让人看到,AI创业不是上不了台面的戏谑语言,也根本不是“寒冬”。早年创立的“AI四小龙”,在奋斗中尝到的,不仅仅是开启AI产业化的苦果,更是作为AI落地先锋的甜头。

“深度学习三巨头”Yoshua Bengio、Yann LeCun和Geoffrey Hinton获得2018年图灵奖后,普遍认为未来十年人工智能领域不会有重大理论突破;相反,人工智能的发展会越来越多的体现在AI技术的应用和与产业的结合上。
换句话说,“AI能赚多少钱”成了新的焦点。随之而来的是越来越多的AI创业公司。
与以“AI四小龙”为代表的老一代80后创业者相比,新一代90后青年科学家在AI创业方面存在一些差异。
比如投资环境。老一代频繁赶上AI投资热潮,而随着深度学习瓶颈和AI技术成果转化困难的出现,新一代创业者越来越多地面对投资人的质疑和找钱的防范,同时面临越来越多的竞争对手。
技术上,最初的AI侧重于感知智能。后来AI融合了更多的知识领域,新一代科学家的创业方向开始更加多元化。除了计算机视觉,还有语音识别、自然语言理解、图形、芯片...
为此,我们策划了“AI创业者”系列活动,邀请年轻一代的AI创业者与我们分享他们的创业故事。第一个创业者,90年代出生的青年学者,在学术界和业界都很有名气。他是circular intelligence的联合创始人,以及《Transformer-XL》和《XLNet》的作者杨·。
1.“激进”的AI落地方法
“我想有一个更激进、更彻底的路径,打破学术界和产业界之间的壁垒。当被问及创业的原因时,这样回答杨。
在投资人眼中,杨和其他循环智能的创始人一样,拥有一份绝对成功的辉煌履历:
我就读于清华大学卧虎藏龙计算机系,师从乔春明·唐杰,2015年以年级第一名毕业。
接着,他到自然语言处理研究排名世界第一的卡耐基梅隆大学语言技术研究所攻读博士学位,师从著名学者鲁斯兰·萨拉赫蒂诺夫和威廉·科恩;;
博士期间,他与图灵奖得主Yoshua Bengio合作发表了“火锅问答”数据集HotpotQA。作为作品发表的XLNet和Transformer-XL,在NLP领域产生了重要影响,成为NeurIPS 2019和ACL 2019的最高被引论文之一。在谷歌的学术引用次数直接超过了1万次...
注:首页引用了杨的谷歌学术论文。
一般来说,卡耐基梅隆大学计算机专业的博士生往往要学习六年才能毕业,而杨从毕业只用了四年时间,一度成为学术圈的风云人物。
作为一名才华横溢的年轻AI学者,杨确定他决心推动人工智能技术在现实生活中的大规模应用。
一般来说,年轻博士生参与技术落地的方式是进入资金雄厚、人多的大厂,在里面谋得一份工作。比如他的两位博士生导师鲁斯兰·萨拉赫丁诺夫(Ruslan Salakhutdinov)和威廉·科恩(Steve Ballmer),学术工作结束后分别负责苹果的AI研究和谷歌的首席科学家。
但杨认为,“科学家加入大厂”的模式在组织结构上有局限性,无法让他更深入地参与AI落地,也无法从根本上解决AI落地在产业上的瓶颈:
“我认为AI行业面临的共同问题是学术界和工业界的差距。我们看到老师在业内有一些头衔,但实际上他们还在做研究工作。基础研究很重要,但不能打破这个壁垒。从研究内容到实际执行还有很多步骤。」
具体表现为:一是高校教师倾向于学术研究,与行业接触较少,缺乏行业的思考和驱动力;第二,同时,虽然很多大的互联网公司会招聘优秀的科学家来解决技术问题,但他们的首要出发点是使能商业,而不是推动AI落地。
从大厂运营的组织架构来看,这些优秀的科学家没有足够的资源或权利将产品推至地面。公司的业务方向会有所调整。即使科学家愿意把一个产品推倒在地,成本和价格也会大幅提高,技术转化率和效率也会受到企业组织结构的影响。
在杨看来,这是一个非常大的局限,这也造成了在大型工厂中,很多AI技术的落地周期非常长,不够敏捷。因此,2019年博士毕业时,他拒绝了谷歌、脸书、华为等大公司的高薪邀约,选择回国创业。
图:杨与两位博士生导师合影。“创业的好处是可以自己决定公司的组织架构。人生短暂,精力有限。优化公司的组织形式,可以有效减少中间损失,拉近技术改造与社会价值的距离。杨对说道。
杨回忆了AI技术的回顾,他的本科和博士导师都非常重视技术的实用价值,这给他带来了很大的启发。不同的是,他会更积极地追求落地成果,进行深入的商业调研。他的计划是学术研究和技术同时进行,同时出成果。
循环智能成立于2016年。也就是说,杨从读博第二年就开始从事学术研究和创业。
正是因为“大厂科学家”的尴尬处境,他才一直强调“我们需要新思维”。在循环智能中,他既是AI技术负责人,又是产品经理,这无疑是一种“范式级创新”,也是他心目中有效打破技术与价值壁垒的最佳方式:
“一方面,我们会做基础研究,比如预训练、多模态等。;另一方面,我们必须着陆。这两个东西可以互相增强,互相促进。」
2.研究和着陆,双轮驱动
陈启聪、杨、张三位最早的人工智能创始人,在清华大学知识工程实验室相遇,他们都有着“用人工智能创造社会价值”的激情。这三个人都有技术背景。后来由于业务发展,循环智能在2018年又引入了一位擅长运营技术产品的“第四手”。
自成立以来,杨一直是团队的核心技术骨干。2016年、2017年,他和陈奕聪、张玉玺开始探索技术的应用方向。
2017年是新一代AI创业者的重要时间节点。
那一年,谷歌团队在《注意力是你所需要的全部》一文中提出了Transformer模型。这个模型没有采用绕线机网络的时序结构和以前的RNN,而是采用了编码机制。编码端同时包含语义信息和位置信息,实现了并行计算,大大提高了语言模型的训练速度。
对于注重技术落地的创业者来说,这无疑是一个利好消息,可以减少前期培训时间,节省研发成本,加快技术与场景的匹配速度。《变形金刚》的出现,打破了计算机视觉在AI创业圈被深度学习垄断的局面,使得大量基于NLP技术的创业公司开始涌现,循环智能就是其中之一。
循环智能的主要业务是利用NLP、语音、多模态、大模型等人工智能技术,打造“销售技术”方案,帮助企业的销售团队提升销售业绩。

杨表示:“我们认为AI产生价值的过程可以分为几个阶段,其中一个阶段是帮助每个人变得更好,提高人的能力,从而提高整个社会的运行效率。这个愿景是我们公司成立之初就有的一个想法。」
据他介绍,循环智能选择用AI来“提升人的沟通能力”,也是经过长时间的探索、与客户的沟通、不断迭代后确定的。最终他们选择的动力还是客户的诉求和整个市场的判断。例如,根据CB Insights的统计,2016年,出售技术初创公司的投资超过50亿美元,然后逐渐增加。这也说明了市场对这个赛道的信心。
注:Gartner的《销售技术成熟度曲线2021》显示,销售赋能团队已经过了“技术萌芽期”,进入“期望扩张区”
如前所述,杨认为,AI系统的组织结构会影响产品的能力,组织结构的灵活设置可以帮助他们以更好的模式将产品推向地面。在创业过程中,杨实现了学术研究和产业落地的双轮驱动模式。比如他收到ACL 2019的文章Transformer-XL,早在发表之前就应用在循环智能的ASR产品上。
杨对这一基础技术的快速转变感到自豪:
“在前期训练的过程中,我们将技术部署在产品系统上,让它以实际数据集的运行效果为最终目标,驱动中间的RD过程。当挖掘系统投入使用时,该系统还以学习和优化最终业务结果为目标。同时在中间过程中可以迭代很多AI问题和基础技术,让后续产品进一步完善。」
在AI模型的落地中,一个常见的问题就是数据集的真实性和完整性。
一般来说,研究人员在改进模型时,往往是基于具体的、人为创造的数据,但这些数据未必能完整、正确地描述模型在实际场景中遇到的情况。因此,虽然一些预训练技术已经在学术界的很多数据集上进行了测试,并且表现优异,但是在实际应用中,仍然需要部署很多技术改进,因为模型会遇到越来越复杂的问题。
目前学术界在解决这一问题上仍然没有突出的进展。但在创业过程中,由于杨及其团队的前期训练技术研究从一开始就在实际数据集上进行测试,并与AI产品框架直接匹配,所以类似的落地问题可以连根拔起。
3.谈“NLP+销售”
除了2017年的Transformer,近年来人工智能领域也涌现出了很多基于Transformer的大规模预训练语言模型,比如Bert和GPT-3。此外,还有很多新兴技术对AI创业者产生了积极的影响,比如少样本、零样本的研究突破。
从NLP技术落地的角度来看,这将是一个革命性的时刻。由于这些研究成果的有机结合,可以大大提高AI模型的效果和效率。在某些场景下,研究人员甚至可以在很少样本甚至零样本的情况下获得和以前一样好的结果。
对于循环智能来说,这意味着在用AI提高销售转化率的过程中,他们可以做很多以前做不到的事情,比如对话洞察、分析引擎等。随着NLP落地技术的逐渐成熟,以及企业服务成为全球新的投资热点,杨及其团队期待循环智能通过“NLP+销售”的路径,成为“中国公. io”的可能性。
具体来说,利用人工智能提高销售效率的过程可以分为三步:第一步,收集销售与客户之间的谈话数据;其次,对有价值的对话内容进行挖掘和建模,将非结构化数据转化为结构化数据;第三,分析谈话数据,找出销售人员与客户沟通过程中存在的问题,更准确地分析客户意愿,给出解决问题的关键要素。
说到底就是高效的分析大规模的文本数据。
听起来很简单,但实际上“AI+销售”是一个同时具备刚需市场和高科技壁垒特征的赛道,因为它要求AI系统具备综合分析的能力。除了算法,对话洞察、数据分析、行业营销知识也不可或缺。这符合循环智能创始团队的创业风格:既要创造价值,又要有一定的技术门槛,以提高竞争难度,减少竞争对手。
从刚需的角度来看,业绩增长是每个企业的发展基础。作为销售营销的一部分,会话流的转化率对业务目标至关重要。根据杨的观察,流量转化率是很多行业的突出痛点,尤其是金融行业。
他们接触过一家国内的头部保险公司X,该公司有一家分公司Y,Y的销售困境在于,虽然Z的销售团队卖出了很多保单,数量远高于X位于邻市的另一家分公司Z,但收到的保费总和却低于Z,经过分析,原因很简单:因为Y的平均保费远低于Z。
这时候他们就需要通过分析现有的数据,找到一个解决方案来挽救自己低迷的业绩。回顾现有的数据,企业唯一的法宝就是保存大量的沟通语音或文字数据。
对于计算机来说,未解码的语音数据就像一个黑匣子,同时又是非结构化的。这时候NLP和语音技术的结合就可以高效的分析这些非结构化的数据,管理一个企业销售团队的沟通过程。换句话说,此时的AI产品仍然是一个“管理手”的角色,分析销售人员与客户的沟通,洞察客户需求,提高销售管理能力和销售团队的工作效率。
“我们提供的产品可以非常清晰准确地展示每个销售人员每天的打开率。它可以定位每一个团队成员的每一个电话、每一次沟通,并可以据此做大量的报告分析,从而知道每个团队的问题出在哪里。杨介绍。
注:圆形智能AI产品原理示意图
根据实际结果,循环智能构建的AI系统每天可以处理超过1亿次对话,帮助Y提升保单平均保费20%左右。目前已与数十家企业合作,销售人员超过1000人,主要覆盖银行、保险、房地产、汽车等四大行业。
杨解释说,“这些行业都有一个共同的特点,那就是它们对销售技巧的要求很高,销售过程非常复杂。同时,相对而言,这些行业都有精细化运营的需求,其精细化程度达到了一定的门槛,足以支撑其应用AI系统优化效率。雷锋。com
在这个过程中,其AI系统后台积累了上千个来自不同行业的语义模型,构成了循环智能AI大脑强大的知识库,有利于NLP模型的进一步落地。去年,他们与华为云合作开发了大型中国模型“盘古”,在一些实际场景中取得了比伯特和GPT系列更好的效果。
目前,循环智能已进行B轮融资,连续三年实现营收增长200%以上。但杨表示,创业一定要深入业务:“我们还处于产品的打磨和成熟阶段,主要任务是拓展和提升销售沟通场景的覆盖。」
4.创业情怀
杨认为,决定一家科技创业公司能否立足的因素有两个,一是多维度的综合能力,二是对行业的深耕,能够将一般产品与细分行业方案有机结合:
“当我们拥有一个通用技术品牌时,我们可以以更低的边际成本将其扩展到新行业、新公司和新的细分场景。所以我们需要一个能够提供专业行业解决方案的“行业专家”团队,然后用这个专业解决方案包装产品进行落地。雷锋。com
Smart有明星创始人团队,吸引综合型人才并不难。杨还强调,搭建一个销售推广的AI系统,不能只靠一群“NLPer”或者“CSer”的力量,还需要硬件人才、营销人才、行业分析师等等。
在技术赋能数字经济的过程中,NLP的核心价值往往体现在最后一公里。对于任何行业来说,只要有数据和文本数据交流的场景,NLP技术就能发挥其价值。传统NLP场景最大的瓶颈是规模,但随着Transformer、少样本/零样本学习等研究的突破,极高的边际价值得到了释放。杨认为,NLP的规模化赋能将在未来几年成为可能。
创业五年,杨总结了自己在技术之外的成长:一是有机会学习商业逻辑,加深对行业和场景的理解;二是学习如何成立和运营公司;第三,可以有更彻底的方法来缩短技术和价值的差距。

十年前,可能很多人认为进大厂是学习实用AI的最好途径。然而,近一两年来,随着越来越多的科技巨头离开互联网大公司,或回归学术界,或自主创业,人们开始意识到需要一种新的运营模式来推动人工智能技术的大规模落地。从这一点来看,杨的选择是相当有先见之明的。
据了解,目前杨在清华大学、致远研究院等机构,除了回收智能创业外,还领导了多个AI研究项目,继续实践他对如何打破研究与应用之间壁垒的思考。在创业和学术的推动下,新一代的实干家,如杨,不仅为中国人工智能的未来带来了“激进”的应用,也培养了从研究结束就开始思考技术转型的年轻人才。
一代接一代,未来可期。
参考链接:
1.https://www . Gartner . com/en/documents/4004056/hype-cycle-for-CRM-sales-technology-2021
2.file/tupian/20220802/p


