链资讯 链资讯
Ctrl+D收藏链资讯

SHG:36氪首发|人机语音交互服务商「一知智能」完成超亿元人民币B轮融资,算法驱动场景化服务升级_Graphen

作者:

时间:

36氪获悉,人机语音交互服务商「一知智能」已完成超亿元人民币B轮融资,由凯泰资本、亿联凯泰以及中信证券投资共同投资。据悉,本轮融资资金将用于算法开发、产品升级、团队建设与新业务开拓。

一知智能是36氪曾报道过的一家企业,于2017年成立,创始团队来自浙大人工智能研究所,是一家专注于人机语音交互技术的SaaS服务商,通过电话、微信、短信等载体为企业触达用户,并实现精细化智能运营。公司凭借自研的语音识别、语义理解和语音合成三大人机交互核心算法,为零售、生活服务等泛消费行业,以及公共服务提供AI场景化智能服务。据一知智能介绍,公司曾先后获得浙江省高新技术企业研究开发中心、杭州市领军型创新团队,中国人工智能学会语音对话与听觉专业委员会单位。

近年来,在AI产业落地的浪潮中,智能语音交互因其交叉学科属性,包含ASR(语音识别)、NLP(自然语言处理)、TTS等多项高难度AI技术,至今依然有较高的应用落地门槛。而从场景需求上来看,在商业活动与政务工作中,以微信和电话为主要交流载体的人员排查、信息采集、定向通知、政务咨询等环节,往往是最费时费力的部分,因此大到各地政府的防疫提示来电,小到消费品牌的大促上新通知,投入智能语音交互技术也已成为政企服务实现降本增效的趋势之一。因此,如何迅速适应通话场景,提升AI语音的对话体验,成为业内人机交互服务商进行技术优化的首要考验。

一知智能创始人、CEO陈哲乾在介绍团队的赛道选择时,把创业故事比喻为“拿着锤子找钉子”的科研式创业之路。彼时,求学于浙江大学人工智能研究所的公司创始团队,便在人机智能交互领域有了丰富的研究成果,曾代表浙江大学多次获得国际性NLP比赛冠军。与AI赛道内其他带有科研基因的团队相类似,一知智能的创业方式也是带着较强的技术寻找拥有商业前景的落地场景。经过近3年时间,在调研机器可以取代人类工作的诸多行业领域后,一知团队最终将产品定位在高频次的人机互动载体——电话,再通过已积累的AI语音技术为智能外呼找到应用场景,由此确定了公司核心技术的商业化方向。也因为拥有了核心算法、算力与数据的支持,后续公司业务的发展锚定双向互动需求较多的消费广告与公共服务领域,便进入了“逢山开路,遇水迭桥”的发展阶段。

对比业内同样聚焦于AI语音机器人与智能语音赛道的百应科技、网易七鱼、智齿客服等企业,陈哲乾认为一知智能的主要差异点在于将公司定位于技术研发型服务商,通过人机对话技术的不断迭代来做深消费品牌的会员智能化服务。从这一定位出发,近年来一知智能在核心技术上有了以下升级:

·ASR:在语音识别提取的过程中,一知智能在webRTCNS(降噪处理代码)的框架基础上,对环境音降噪与人声增强进行双向优化,实现双模并行。同时,公司使用MFCC+resCNN提取算法方案,细化机器人在性别、年龄与情绪识别中的感知颗粒度。

在通用场景识别的E2E模型中,一知智能在传统语音识别架构AED的基础上做了场景化升级,自研了基于上下文文本定制增强模块的Context-AwareEncoder算法,在模型训练过程中,使用额外补充的场景文本作为强化信息,让模型建立起针对特定输入的强化架构,提高特定垂直场景中的语音识别率。

体现在场景应用上,该项技术能过滤沟通中的环境噪音干扰,并使机器人能快速识别用户的年龄、性别与情绪,根据当前情景选择最合适的对话内容。

·NLP:一知智能已于日前升级了新一代对话架构NLP2.0。在实现意图识别、情感识别、问答识别、任务对话、智能纠错,知识图谱等NLP常见任务之外,新的对话架构还提出了在泛消费领域的专用大规模预训练语言模型“EAZI”——在Transformer架构基础上,基于语言学知识与大量垂直数据,以NLP算法驱动语义理解,改进模型架构与预训练策略,并且针对大量的消费领域信息与公司已积累的消费场景对话进行专项训练。

体现在场景应用上,此项创新在问卷调研、用户满意度调研等外呼需求中,解决了时间、地址、组织名称等实体信息提取的难点,机器人在应对消费场景客户调研中的复杂问题时,也能快速找到对应答案。

·Fastspeech系列语音合成算法:浙大一知人工智能联合研究中心,联合微软共同推出FastSpeech1和FastSpeech2两代算法系列,集合了语音合成、情感合成和语音克隆算法,以及相应的语气词回复生成算法。

据一知智能介绍,该算法系列相较于谷歌的tacotron两代算法,在同等实现效果上,速度分别提升了38倍和260倍。体现在场景应用上,机器人在沟通中能够逼真地模拟人类情绪,并能在识别对话方情绪后及时给出回应。

一知智能行业knowhow沉淀

关于公司的商业模式与应用,一知智能CFO张蕾介绍到,公司的服务场景主要包括:会员激活、邀请加微信私域、生日&会员节关键时刻打造、大促节点活动通知、反电诈、疫情回访通知、银行逾期提醒等。目前已为300余家消费品牌、100余家地市局提供AI语音服务。在泛消费领域,公司已与雅诗兰黛、薇诺娜、奶酪博士、汤臣倍健等消费品牌达成合作,主要需求方为消费品牌的电商、用户增长及营销部门。核心产品以广告投放逻辑按季度/年充值服务费,按CPA结算,收取成功触达费,中大型客户的年框合作客单价为50至100万元不等。

在团队方面,一知智能目前有200多名员工,核心创始团队来自浙大人工智能研究所。公司于2019年2月成立浙大·一知人工智能联合研究中心,围绕多模态人机交互展开产学研结合,在语音、语义领域与华为、微软亚洲研究院、阿里达摩院等多家企业进行联合研发,并进行相应工程化落地。

本轮融资后,公司将推进海外业务布局,推进跨语种人机对话技术自研与商业落地,打造面向全球的智能语音交互SaaS平台。

从市场发展看,根据鲸准研究院数据,目前国内呼叫中心约有100亿的市场规模,但在智能语音赛道主要切入的存量市场,始终是机遇与挑战并存的状态,一方面,当前消费与公共生活服务智能化改革的深入,人机语音交互服务已成消费企业与政务部门提效的有力工具,而另一方面,随着综合整治个人隐私专项政策的出台,对智能外呼行业的严格监管也将市场规模收窄在数据隐私安全的框架之内。目前赛道中的AI语音公司,除了以AI语音通话算法为业务核心的垂直服务商,像一知智能,也有互联大厂对于智能云客服系统部署的企业,像网易七鱼、京东言犀,更有私域营销出发尝试人机交互新技术的企业。底层技术与开源架构趋同的智能外呼公司,如何在赛道中跑出差异化,需要在技术与客户场景双重层面寻找答案,对于国内市场逐渐趋于饱和化的状态,跑通出海服务的商业模式也成为了新的机遇之一。此外,在不断拓宽服务场景边界的同时,如何解决随之而来的信息隐私与安全的隐患,也是赛道内企业在战略优化中需要深思的问题。

标签:SHGRAPGraphHASHDASHG币Wrapped TelosGraphenHashPuppy

以太坊交易所热门资讯
PEACE:比特币一定会归零,闪电网络不是救命稻草_Internxt

在最新发表的一篇采访中,DashCore首席执行官RyanTaylor讨论了达世币加密货币项目,他认为比特币将无法长期生存.

PEACE:以太坊经典和以太坊之间的“和平之桥”_比特币

作者|哈希派-不碎 文章字数:3000字左右 阅读时间:约4分钟 "单一区块链获胜的概念并不能反映人类进步的整个历史,在当下技术如此早期的阶段,激烈的竞争对于我们来说毫无意义.

APH:专访Hedera CEO:详解哈希图、DAG与八卦协议_ASH

LeemonBaird 链得得注:,是链得得App推出的区块链技术分析系列栏目。由链得得App独家作者马文佩,对区块链、数字货币市场中前端技术方案进行应用层讲解与热点事件的技术层分析.

ARB:Arbitrum (ARB) 2023 年价格预测—ARB 会很快达到 2 美元吗?_Rbicycle

2023年看涨的ARB价格预测为1.2484美元至1.3625美元。Arbitrum(ARB)价格可能很快达到2美元。2023年的看跌ARB价格预测为1.0522美元.

ARB:BNB销毁再创纪录,从此BNB不再是币安币_Arbitrum

从7月开始,就到处充满着币安三周年庆典的味道,币安三周年前一天一直到正式开始,热度推向了高潮。众多行业知名人士集结币安三周年大会,可以说盛况空前.

OSMO:赛迪研究院第13期公有链技术评估 比特币排名稳步上升 位列第11_OSM

7月30日,第13期赛迪全球公有链技术评估指数发布,互链脉搏授权首发。本期公有链技术评估指数调研期间,比特币价格重回高峰,因此带动比特币排名上升.