百川智能:超级模型+超级应用双轮驱动

百川智能:超级模型+超级应用双轮驱动

07月26日

智谱AI、月之暗面、百川智能、MiniMax、零一万物五家大模型公司被戏称为“中国大模型五虎”,本次我们就来探究一下北京百川智能科技有限公司(以下简称“百川智能”)。

这家由原搜狗创始人王小川二次创业的AI大模型公司,2023年4月成立,在2023年10月仅用不到半年时间,就完成了估值超过10亿美元的成就,跨入独角兽行列。

同时,他也与我们之前研究的智谱AI月之暗面一样,均具有明显的“清华大学”印记。

1、成立背景

2023年4月,在大众视野消失了2年之后,王小川在搜狐网络大厦举办了一场备受瞩目的媒体见面会,他携手前搜狗首席运营官茹立云,共同宣布联合创立了一家专注于大模型技术的创新型企业——百川智能。

王小川,搜狗的创始人,在加入搜狐仅十几月后便成功推出了搜狗搜索,迅速在互联网搜索领域占据了一席之地。

他没有止步于此,更进一步推出“搜狗浏览器+搜狗输入法+搜狗搜索”的“三级火箭”,推动了搜狗业务的独立发展,并最终在2017年实现搜狗独立美股上市,是互联网行业的一个标志性传奇人物。

2020年,腾讯向搜狗发出全资收购要约,这笔11.8亿美元的收购案最终在2021年10月完成,王小川宣布卸任搜狗CEO。

在告别信中他表示:

往后二十年,若能为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,生命就更有意义了。

2023年,王小川在1月份亲自体验了ChatGPT后,深刻认识到"通用人工智能时代"的曙光已经到来。

大模型将自然语言变成了数学模型,让机器能够用人类的语言沟通、交流,它带来的是人工智能技术范式的革新,不仅会颠覆千行百业,更将创造全新的价值。

大模型这一新变革,也让王小川看到了AI医疗新的路径,于是他决定重返科技舞台,携带着他对人工智能和生命科学的原始热情和愿景,投身到大模型引领的 AI 新浪潮中。

在公司成立后,百川智能动作迅速,成立半年便接连发布baichuan-7B/13B、Baichuan2-7B/13B、Baichuan 192k、Baichuan NPC、Baichuan 4 等 11 款大模型,覆盖了开源、和闭源领域。

此外,还与国家级研究机构鹏城实验室共同发布的128K长窗口大模型“鹏城-百川·脑海33B”。其中, Baichuan 4在国内权威大模型评测机构评测中,模型能力位居国内第一梯队,多项能力超越国外主流模型。

在基础模型行业领先的同时,百川智能于今年5月推出了首款AI应用百小应,定位懂搜索、会提问的AI助手。

百小应不仅具备多步搜索、定向搜索等能力,能够为用户提供更准确、更专业、更有深度的知识,还能通过一系列提问解决用户提问过于笼统、抽象,无法清晰表述需求等问题,帮助用户获得更精准的答案。

2、团队构成与专业背景

百川智能的创始人王小川、联合创始人茹立云、洪涛均为清华大学背景。公司人才团队均是搜狗、Google、腾讯、百度、华为、微软、字节等行业头部科技公司的精兵强将。

(1)王小川——CEO、联合创始人

王小川,百川智能创始人、CEO,清华大学工程博士。曾任搜狗公司CEO、董事,搜狐高级副总裁兼CTO。

作为搜狗创始人先后主持开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品,首创行业追赶者破局搜索的唯一成功模式——“三级火箭模式”。先后推动了阿里巴巴和腾讯战略入股搜狗,2017年,王小川带领搜狗在美国纽约证券交易所成功上市。

(2)茹立云——联合创始人

茹立云,百川智能联合创始人,葡萄智学创始人,清华大学博士。曾任搜狗公司COO,清华大学天工智能计算研究院副院长。

2005年,茹立云加入搜狗搜索。在他的带领下,搜狗搜索在多个搜索领域均取得不俗成绩,率先发布分类搜索、推出全新的知识库搜索引擎知立方、搜狗语音助手等产品,并成为唯一一家能够提供“通用搜索”、“微信公众平台搜索”及微信内容差异化阅读服务的搜索引擎。

任职搜狗期间,茹立云带领搜索事业部不断进行技术创新的探索,在提升搜狗品牌影响力及市场占有率上发挥核心作用,并帮助搜狗树立了搜索行业的新标杆。

(3)陈炜鹏——技术联合创始人

陈炜鹏,百川智能技术联合创始人,主要负责大语言模型技术部分。

陈炜鹏曾任搜狗搜索研发总经理,负责搜狗通用/垂直搜索和推荐系统的研发工作。搜狗被腾讯收购后,陈炜鹏加入Soul,担任技术VP,负责算法能力建设,推动内容理解、推荐技术和AIGC技术在社交场景的应用和落地。

(4)洪涛——商业负责人、联合创始人

洪涛,百川智能联合创始人,主要负责商业化工作。洪涛毕业于清华大学,曾为搜狗公司首席营销官。

洪涛早期任职于康佳、雅虎等公司,于2005年加入搜狗公司,曾带领搜狗公司跻身互联网公司广告收入第六位,为搜狗的高速发展起到了关键作用。

作为营销事业部总经理,打造了搜狗输入法、浏览器、搜索的推广体系,并获得巨大成功,也为技术主导的搜狗公司注入了运营的基因。

洪涛所负责的公司搜索营销体系及商业产品体系,在搜狗由弱变强过程中实现了商业闭环,保障了公司的生存和持续发展,使搜狗得以跻身为互联网广告收入前列的公司。

3、百川智能大模型介绍

自去年4月成立以来,百川智能已经发布12款模型,王小川提到,百川智能之后会放慢模型的发布节奏,频率为按照季度发布,目前整体的思路为超级应用+超级模型双轮驱动

2024年5月,发布最新一代基座大模型Baichuan 4及首款公司描述为“最懂搜索、会提问的”AI助手「百小应」。

(1)Baichuan系列主模型

2023年6月15日,百川智能刚成立不到2个月就发布第一款免费商用的大模型Baichuan7-B并开源;7月11日,第二款Baichuan-13B发布;

8月8日,发布Baichuan-53B闭源大语言模型。

2023年9月6日,Baichuan-7B升级到2.0版本,发布Baichuan2-7B、Baichuan2-13B两款免费可商用的开源模型,并且公开了Baichuan2-7B的技术报告,详细介绍了Baichuan2-7B训练的全过程。

2.0版本系列模型在评估任务中,大幅领先全球范围内最强的LLaMA2。Baichuan 2系列模型,在开源社区github的下载量已经超过了700万次。

2023 年11月16日,百川智能与鹏城实验室宣布携手探索大模型训练和应用,合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。

“鹏城-百川·脑海33B”的128K长上下文窗口基于“鹏城云脑”国产算力平台训练,未来可升级至192K,是基于国产算力训练的最长上下文窗口。

2024年1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3,根据当时SuperCLUE测评,Baichuan 3展现了出色能力,在中文任务上更是超越了GPT 4,是中文医疗任务表现最佳的大模型。

2024年5月22日,百川智能发布最新一代基座大模型Baichuan 4。

Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,根据当时SuperCLUE测评,模型能力国内第一。

中文通用大模型综合性测评基准(SuperCLUE)是针对中文可用的通用大模型的一个测评基准。

根据2024年7月9日发布的SuperCLUE最新2024年6月测评,Baichuan 4在国内大模型中并列第4名,总体排名第10名,与月之暗面的Moonshot(kimi)得分一致。

模型价格

(2)Baichuan-NPC角色大模型

2024年1月,百川智能正式发布角色大模型Baichuan-NPC。

Baichuan-NPC优化了“角色知识”和“对话能力”,使模型能够更好地理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色更加真实生动。

除模型外,百川智能还推出了“角色创建平台+搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。

为了验证模型各项能力,Baichuan-NPC参与了CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演Agent评估标准)评测,测试结果显示其在对话能力、角色一致性、扮演吸引力等方面具备优势,位于中文领域角色模型前列。

模型价格

(3)AI助手“百小应”

“百小应”是百川智能成立之后推出的首款AI应用,名称源自“一呼百应”。

百小应很好地融合了Baichan 4大模型与百川智能的搜索技术,具备多轮搜索、智能定向搜索等能力,将百小应打造成一款懂搜索、会提问的AI助手。

  • 多轮搜索和定向搜索:百小应具备多轮搜索和定向搜索的能力,能够更精准地理解用户需求,提供专业、丰富的知识和资源。它通过逐步解析用户的问题,深入探究问题的核心,提供更专业和深入的信息。

  • 结构化信息呈现:百小应将搜索结果以结构化的形式展现,如表格等,使得复杂信息一目了然,便于用户快速获取和理解。

  • 交互式提问功能:面对用户模糊或宽泛的查询,百小应通过智能提问引导用户细化需求,从而提供更加精确的解决方案。

  • 文档阅读与分析:用户可以上传各种格式的文档,百小应能够快速阅读并分析内容,即使是复杂的学术或财务报告也不在话下。

  • 多模态交互:结合Baichuan 4的先进能力,百小应支持图片上传和解读,使得用户可以通过更丰富的媒介与AI进行互动。


在搜索结果呈现方面,百小应同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为观点、论据直接应用到问答结果中。

我们也就以下两个问题在“百小应”和“Kimi”进行了提问对比。

问题1:打算举办一场50人参加,预算花费10万元的婚礼,请协助出具策划案

问题2:人机交互领域有哪些经典著作和最新研究成果?

问题3:请分析比亚迪年报(2023年,共266页,9.19MPDF),并提供重点信息。

Kimi

百小应:

根据测试,两者之间各有千秋,Kimi在长文方面阅读能力较强,百小应通过多轮搜索上有更好的针对性。

(4)AI健康顾问(内测)

百川在落地场景上选择的是医疗领域

王小川离职搜狗后,曾在2021年表示:

往后二十年,若能为生命科学和医学的发展尽一份力,为大众健康做一点贡献,生命就更有意义了。

百川智能拿出的产品就是AI健康顾问。

2024年7月,在WAIC 2024上,百川智能展示了内测的AI健康顾问。

AI健康顾问依托通用医疗增强大模型,不仅拥有丰富的医药学知识,并且还具备医生思维。它能够像从业多年的全科医生一样,在用户提出问询之后,根据用户的问题持续提问,从更多维度更深入地了解症状。

这使得它能像人类医生一样,收集到足够多病症信息后,进行综合判断,给出诊断结果和用药建议。

百川的通用医疗增强大模型不仅在USMLE(美国医考)的评测中超越了GPT-4,并且在由医生(协和、北医等头部三甲高年资主任、主治医师)和心理学专家作为评测主体,对模型进行多角度评测的真实人工评测中,同样超越了GPT-4。

5、估值及融资情况

百川智能 A 轮融资超过 50 亿元人民币,即将开启 200 亿人民币估值的 B 轮融资。

A轮融资:2024年7月,百川智能完成A轮融资,金额为 50 亿人民币。投资方包括阿里、小米、腾讯、亚投资本、中金等头部大厂和市场化投资机构,北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金。

6、小结

随着百川智能在AI大模型领域的迅速崛起,我们见证了一个由经验丰富的团队驱动的创新历程。从搜狗的辉煌历史到百川智能的新兴成就,王小川及其团队展现了在技术变革浪潮中不断探索和突破的决心。

百川智能不仅在短时间内推出了多款具有行业领先性能的大模型,更通过“百小应”AI助手和AI健康顾问等应用,将人工智能的潜能转化为实际的社会效益。这些成就标志着百川智能在AI赛道上的坚实步伐,也为公司未来的发展奠定了坚实的基础。

展望未来,AI大模型的竞赛才刚刚开始。正如OpenAI所定义的AGI五级标准所示,当前所有模型仍处于智能发展的初级阶段。

百川智能凭借其后发优势,通过不断的技术创新和深入场景应用,完全有机会在这场长跑中实现领跑。随着技术的不断进步和市场需求的日益增长,我们期待百川智能能够在AI领域带来更多颠覆性的创新,推动整个社会向更智能、更高效、更健康的未来迈进。

- END -


 
今日热点

博越REV售10.79万起,375km纯电续航,十年积淀再掀市场热潮


方程豹钛3及钛7纯电闪充版发布,钛3闪充版3月13日专场上市


一汽奥迪时代精英盛典暨全新奥迪A6L家族上市发布会圆满举行


小鹏P7携第二代VLA上市,新增三色售价20.38万元起


大众严选 9久相伴 一汽-大众春季新品发布会五车齐发


款款皆“满配”!上汽大众“增程新王”ID. ERA 9X预售32.98万元起


官宣!3月31日全球首秀!FREELANDER神行者即将发布全球品牌战略


全系搭载比亚迪第二代刀片电池及闪充技术,宋Ultra EV售15.19万元起


金标大众全新旗舰与众08开启预售 23.99万-29.99万元


FREELANDER神行者全球首秀,5年6款新车剑指全球豪华新能源市场


全新坦克700用麒麟+敦煌,造出国人自己的旗舰SUV


零跑汽车再度冠名浙江FC 共战2026新赛季


FREELANDER神行者首秀,为新合资、全球车和豪华科技立起了新标准


最美人间四月天,一汽丰田品质见证,伴你省油省心自在行