小冰完成A轮融资,李笛:未来AI beings无处不在|5Y News

五源资本五源资本·2021年7月13日

发布超级自然语音技术,人工智能无限接近真实人类的声音。

7月12日,小冰公司发布全新的超级自然语音技术。该技术首次将人工智能语音自然度提升到与真实人类声音几乎无法分辨的程度,并支持通用全域场景。

小冰公司还披露了A轮融资信息。本轮融资由高瓴领投,五源资本、Neumann、IDG、GGV纪源资本及上轮投资人北极光与网易公司跟投,小冰估值已超过独角兽规模。

五源资本合伙人张斐表示: “Harry(沈向洋)、李笛以及小冰团队是我非常尊敬和欣赏的团队,他们在自然语言交互方面做了非常多有趣的探索,也正在挑战通用人工智能的终极梦想。在波澜壮阔的人工智能发展道路上,我们相信并愿意支持这些尝试突破人类局限的疯狂想法,预祝他们取得大成功。”

李笛

小冰公司CEO

Q1

小冰未来五年、十年要做的事情是什么?你希望小冰会成为一家怎样的公司?

李笛: 小冰是一个完备的通用人工智能框架。而十八岁少女小冰,只是这个框架孕育的第一个原型。假如我们把小冰框架比喻为一片沃土,那么少女小冰是这片沃土森林当中的一棵树木。

我们用了六年时间,在微软体系内一点点构建了这个框架的各个组成部分,让自然语言处理、计算机语音、计算机视觉和人工智能内容生成技术能够融合形成一个有机的整体。 这样,它能运转起来,形成技术、产品和脱敏数据之间的循环。我们把过去的这些定义为Phase I。

而接下来的几年里,**小冰Phase II的任务,是让这个框架孕育出数以亿计的AI beings。**它们每一个都像那个十八岁少女小冰一样完整,但无论是对话、观点、声音、视觉甚至创造能力,又都是独一无二的。(今天同时发布的超级自然语音技术,就是其中的一个技术承载,它的重点不仅仅是自然,更是能同时支持大量差异化的Voice Fonts。)我们的工作将是促进这样的AI beings无处不在,使它们的差异化明确而稳定,促进训练工具的普及,并与人类用户建立信赖。

最终,这个世界将是人与人工智能交织的新形态。人工智能将丰富多彩,而不仅仅是少数几个助理。**而小冰框架是支撑这些人工智能Instance的底层框架。你可以把小冰框架理解为它们的OS。**这个比喻虽然并不准确,但比较简洁。这就是小冰团队的使命。

Q2

回顾近几年小冰的发展,你觉得哪些事情做对了?哪些事情还可以做更多?

李笛: 人工智能——特别是AGI——今天还处于早期萌芽的阶段,有些类似于孟德尔发表遗传学定律前后的状况。因此,今天不仅是相关技术尚有巨大的进化空间,就连其背后的基础理念,也都远没有到定型的阶段。积极地来看,这意味着我们这些从业者有相当多的机会去发现新知。一个例子就是,几年前人们还普遍将注意力集中在封闭域上,而今天,包括谷歌、Facebook等,也都开始更多地倾向于我们所专注的开放域。与算法相比,理念的碰撞与变革更加激烈。

在这几年里,小冰做对了的几件事,我认为最幸运的,是我们较早认识到搭建真实场景用户循环的重要性。**人工智能在实验室中的发展速度很快,但真正的加速,其实来自于真实用户的迭代循环。**今天,全球范围内大约有60%的人工智能交互数据由小冰框架所承载,并且交互场景丰富度较高,这是我们能够快速发展技术的主要推动力。

其次是metrics的选择。特别是对于基础框架而言,由于它往往涉及到许多技术的融合,metrics就更加重要了。我们在不少核心metrics的定义上保持着小冰团队的独特思考,例如在对话引擎上的CPS (Conversations per session),在语音上的ACD(Average comfort duration)等,从今天来看,是我们能够在开放域和自然情感拟人交互道路上形成优势的重要原因。

当然,无论我们,还是我们的同行业者,今天都还处于萌芽状态,这意味着我们今天所发现的,有可能被明天的我们再次颠覆。

Q3

为什么选择五源资本的投资?

李笛: 我们和五源是天作之合。Fisher(张斐)是我们团队非常尊敬的人物,我们在对未来的构想和基本追求上相当一致。而五源的许多经验,也是小冰团队在过去微软阶段所不具备的,这些都是我们与五源携手的原因,小冰团队也对未来更有信心了。相信我们能一起为人们开启人与人工智能交织的未来世界之门。

小冰公司即原微软小冰团队,是全球承载交互量最大的完备人工智能框架之一, 技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。

为加速其发展,2020年7月13日,微软宣布将小冰分拆为独立实体,并继续保持投资权益。分拆后的小冰公司,将促进全球前沿技术与本地化的产品融合,扩展在人工智能基础研究方面的领先优势。

此次发布的小冰超级自然语音技术,不仅将自然度提至新的高度,也是全球首个全域通用的同类技术。 它突破单一场景限制,使人工智能交互主体能够在说话、交谈、歌唱等人类全场景中,进行高度拟人交互。

目前,小冰框架中的数百个不同人工智能原型主体,已全部完成升级。公开技术示范视频显示,人工智能与真实人类的声音已很难区分。

五源资本(原晨兴资本),目前管理约五十亿美元规模的美元和人民币双币基金。我们相信,如果别人眼中疯狂的你,开始被相信,世界会更美好。

BEIJING·SHANGHAI·SHENZHEN·HONGKONG

WWW.5YCAP.COM