
院友专访
SJTU

上海交通大学计算机学院特别策划“我和计算机的故事—院友专访”系列活动,邀请代表性院友回溯成长轨迹,分享心路历程,以飨后学,为新一代交大计算机人树立榜样力量,引领前行方向。
本期嘉宾:汤敬华
2005届上海交通大学计算机学院软件工程专业硕士毕业,2022级计算机学院电子信息专业博士在读。2005年,他带领技术精英团队创立声通科技,开启探索人工智能与通信技术融合的征程。声通科技于2024年7月10日成功登陆港交所主板,成为“交互式AI第一股”。
# 交大人 #
Chapter 1
【每一段学习经历都让我走到一个新的台阶】
>1m28s-2m53s <
回顾求学之路,汤敬华坦言自己并非传统意义上的 “学霸”。本科毕业后首次考研失利,他选择先投身职场积累经验。工作两年后,对知识的渴望和对职业发展的规划促使他再次考研。2002年,他成功考入上海交通大学软件学院,成为第一批软件工程硕士。读研期间,他一边学习一边工作,将理论知识与实际工作紧密结合,于读研期间创立了声通科技。
2021年,在企业核心技术向人工智能方向发展的关键节点,他报考了上海交通大学计算机学院电子信息专业博士,在疫情后入学深造。他感慨道:“计算机行业属于一个知识快速迭代的行业,每一段学习经历都让我走到一个新的台阶上。”
# 创业路 #
Chapter 2
【科技为核 构建生态】
>2m55s-13m27s <
2005年,汤敬华硕士研究生即将毕业时,面临着找一份收入更高的工作与自行创业两条路。一方面,房价的快速上涨让他意识到,按部就班地工作可能难以改善生活条件;另一方面,在软件应用领域工作六七年的他,对市场有着自己的判断。“2001 - 2005 年,融合通信领域存在着国产替代和技术从数字化向IP化转型的两大机遇,我们没有老牌企业的历史包袱,有后发优势,值得一试。”于是,28 岁的他毅然选择创业,凭借着对市场机遇的把握,他带领声通科技开启了未知的征程。
声通科技成立初期,主要聚焦于将通信与企业内部信息系统相结合,把电话、邮件、短信等多种通信媒体接入企业的内部流程。随着业务的推进,他发现单纯的媒体接入无法满足企业高效沟通的需求,于是开始着手对企业内部流程进行升级,逐步拓展业务范围。到了 2016 年,在数据积累和算力提升的基础上,应客户需求,声通科技开始研究人工智能模块。经过多年的发展,从一个个独立的人工智能模块,到交互式人工智能解决方案,声通科技完成了从信息化到数字化,再到智能化的转型升级。与同行相比,声通科技的独特之处在于完整经历了20年的技术演进过程。由于深耕特定场景,声通科技在通讯模块、人工智能语音识别等方面形成了自身优势,针对特定客户群体和应用场景,优化算法和基础框架,在交互式人工智能领域站稳了脚跟。早在 2016 年,公司就提出了“科技为核,构建生态”的发展战略。随着企业实力的增强,具体执行方式不断丰富。从早期自身研发,到联合上海交通大学成立应用实验室,再到成立涵盖科技、文化品牌、商业模式的创新实验室,尽管形式在变,但构建生态、赋能合作企业的初衷始终未改。
一路走来,创业之路并非一帆风顺。“挑战一直都有,不同阶段面临不同问题,现在可能就是最困难的时候。” 公司上市后,虽然走上了新台阶,但也面临着新的挑战。从单纯关注企业盈利,到需要兼顾投资人与公众的看法,考虑维度变得更加复杂。回顾创业历程,汤敬华感慨:“当公司有了三五个员工,那你就必须得硬着头皮、咬着牙继续往前走。企业发展过程中,该踩的坑一个都不会少,有过很多难忘的经历,但还好都爬起来了。”
# 经验分享 #
Chapter 3
【第一要持续学习 第二要有格局】
>13m29s-16m10s <
对于致力于在计算机行业发展的学生们,汤敬华强调三点:学习、格局和担当。“这个行业知识技术更新迭代特别快,持续学习能力对个人和组织都至关重要,虽然过程痛苦,一旦突破过去,还是会给自己很多回报。” 同时,打开格局不仅要关注技术前沿,还要拓宽商业模式、政策等方面的知识面。
谈及教育,他结合自身经历提出了独到的见解:“在学校应该按照学习框架,扎实掌握基础科目,同时要培养自我学习和管理的能力,工作后很多知识可以逐步填补,但基础不牢会限制发展高度。学校在关注学生就业的同时,也应平衡好基础教育,避免过度以市场为导向。”
从求学时的不断进取,到创业路上的摸爬滚打,再到对行业发展的深刻思考,汤敬华的经历,不仅是个人奋斗的缩影,更折射出交大计算机人在时代浪潮中的成长与蜕变。
# 提问箱 #
Chapter 4
【声通最主要的创新是不执着于某一个模型】
>16m12s-29m10s <
@孙永强教授
整个交互式人工智能解决方案,前端有多媒体感知,中间有人工智能的理解和生成。怎样保证决策的准确?在要求绝对准确的场合怎么办?
华言华语:人工智能时代,我觉得对“准确”这个词可能要有不一样的理解。以前我们对计算机的软件,觉得准确就应该是100%,但是到人工智能时代,我们可能要讲一个概率。就像机器视觉开始替代人去做安检的时候,并不代表机器视觉是100%对,只是它的识别率超过了一般人的处理能力……有时候并不认为 99.999% 就一定好,有可能为了增加最后的9,花了无数大的代价,其实性价比并不高,而且这种成本会转嫁给你的客户。所以到人工智能时代,我们讲的“准确”实际上是要跟场景匹配起来。如果说是要求绝对准确的场合,那我觉得它可能最多用点智能做辅助,大部分可能还是原来的机械式规则性的东西……我们在去年提出整个未来的人工智能的发展,特别在商业化落地的时候,要做可信人工智能,即相对准确的人工智能。怎么做到呢?前端要多模态的感知,在问题过来之后,还需要多模型去解决。有多个模型相当于人是通过多个角度进行思考,有的根据经验,有的根据逻辑推理、反向验证、类比思维等。其实每一种我刚才讲的可能都对应计算机科学当中的某一种算法,实际上你把多种模型算法结合在一起最后出来的结果,可能准确度就会相对提升,但是是不是能做到100%准确,可能还是挺难。
@唐同学
1.如何权衡大模型的泛化能力与小样本、零样本模型的灵活性?声通科技在这方面采取了哪些创新策略?
华言华语:我们有一个基本观点,算法它是没有好坏的,只有对场景适不适用……不管是哪一种,其实我们都在考虑它的泛化能力,即生成能力,对问题能产生什么样的结果,结果的准确度怎么样。如果从这个角度来说,我觉得都需要,只是说在生成的时候,可能样本数更大,面对的问题空间也越大,灵活度会更大一些,但是,不是所有的场景都需要一个大的灵活度。我觉得我们最主要的创新是不执念于某一个模型,声通科技研究了很多个模型,我们关注的是在什么样的场景用什么样的模型适合,甚至在同一个场景不同的工序里用什么样的模型适合……我们要做的创新实际上一个是在这个问题的前提下有没有更好的模型,或者把这个模型做一些更大的优化,第二就是找到合适的模型去做。
2.从“多模态感知”到“协同决策”,您觉得实现真正的“类人交互”还面临哪些技术瓶颈?
华言华语:还有很多瓶颈,我觉得整个这一块其实刚刚开始,有些事情对人来说都是很难的……我们现在碰到的比较大的问题是,在多模态感知这个世界的时候,有两个重心点,一个是很多时候我们能不能做到,不要所有的场景都从头开始学,我们这两年也在研究像迁移学习这样的先进算法,我们在一些场景里面学习好了,到另外一个场景的时候是不是很快能迁移过去,而不要从头再开始,用一个比较少的数据就能达到一个很好的效果。第二是当一个真实问题出来的时候,前面那么多模态的信息,在这个问题上我要各自摘取哪些?怎样做到信息的对齐?怎样做到有效的筛选?其实这个是挺难的。协同决策的时候,一个是我内部的协同决策……如果再进一步,我们在很多隐私计算联邦制学习里面要做的是,当我们是不同的商业体,我们还要共同来商量做一个事情,我们的数据是不能共享的,我们是不是已经建立起一个很好的信任关系?我们说的是不是真的?这就是我们讲的协同机制。我觉得在过去这么长时间,包括大模型出来之后,实际上是给人工智能未来的发展奠定了一些基础。如果说能做到类人交互,这里面可能还有很长的路要走。
3.在技术与商业落地之间,您如何定义“技术路线的正确性”?有没有曾经“赌错”方向的经历?
华言华语:赌错太多了,大家现在看到的都是不多的正确的结果,好在错的时候没把自己错死掉。因为这个错不一定是技术路线错,你的技术路线肯定要对,否则你解决不了现场的问题。即便技术路线对,你研发出一个很好的东西,你有没有商业落地能力,其实这个对企业来说也是很现实的问题。还是要以市场为导向,如果你的技术路线是适合客户需求的,哪怕这个技术路线很落后也没问题。
4.您如何看待当前AI泡沫与实际应用之间的落差?哪些“伪需求”值得警惕?
华言华语:现在AI的泡沫其实主要在于两个方面,一个方面从做AI技术的这一方来说,我们看到了太多的企业,有几个模型做得非常不错,然后就试图用这个模型去解决所有问题……另外一方面,确实一些新的技术出来,它是很冲击眼球的,那也造成了当大家半懂不懂的时候,会对这个技术的未来使用有过度的期望,那么泡沫总归会破灭的,破灭以后真正沉淀下来的东西也许是一个更为良性和可持续发展的东西。我基本判断,如果它只讲技术的先进性,其实我是不太认可的,但是如果这个东西能给对方挣钱,挣不了钱也能节约成本,那这个可能就是一个真实的需求,这是挺容易去衡量的。
@朱同学
AI创业最核心的竞争力是什么?对于还在学习的学生,或者是像我这样已经踏上社会的毕业生,应如何培养这种能力?
华言华语:我觉得创业理论上最后还是要追求一定的经济回报,所以你要做有价值的事情,做价值可变现的事情。至于AI创业,你是通过自己的AI核心技术来做,这里面我觉得最要规避的就是我刚才讲的,不要去泛化,把一种AI的能力认为可以解决所有的问题……AI创业的最核心竞争力,我觉得加上AI两个字,我们就要知道AI技术的边界,你创造什么样的价值,你是不是有能力去把价值变现,不仅是技术,有可能是市场。我觉得对年轻人来说,如果方向还不是特别明确的时候,广泛地阅读和学习可能是有帮助的。我一直建议,本科毕业以后你不知道自己喜欢做什么,擅长做什么,我会建议前3到5年尽可能地去多做一些尝试,但是3到5年以后,一定要找到一个自己喜欢并擅长的事情,坚持十年,十五年,变成这个行业的专家,我觉得这是个挺有意思的事情。
@肖同学
创业过程中有遇到过什么差点放弃的情况吗?又是怎样克服的呢?
华言华语:虽然我也经常喜欢开玩笑,世上无难事,只要肯放弃。但是对我们做企业来说,很多时候你必须得坚持下去,你没有退路,选择放弃你就死了。我自己的心态是这样的,哪怕努力了,最后还是死了,那也就算了,命不好,但是如果不努力,肯定会后悔的,我们不要去做这些让自己后悔的事情。可能明明只有1%的希望,而且你要争取这1%的机会,你觉得自己要低三下四地去求很多人,感觉拉不下面子,但是你自己想想,如果这一步你不去试一下的话,你可能会后悔,那我还是会去试,哪怕最后说这个结果确实不行,我至少心安。
@邱同学
为什么您之后会想着回校园读博呢?如何看待读博这件事?你是如何做出这方面选择的?会考虑哪些因素?
华言华语:被逼的。不回学校读博也还是继续自己的工作,但是读一读,借读的机会更系统地去梳理自己的知识,我拿这个事情逼着自己系统化地把人工智能的一些底层的东西重新学习了一遍,同时我觉得在读博这个过程里面,确实也提升了自己技术的眼界和底蕴,对声通科技走到人工智能之后,该走哪个技术路线其实有了一些更深刻的理解。现在公司总体的技术架构和商业架构,我会自己来定,不一定我比他们强,但是我比他们可以去承担更大的责任。反正对读书,我一直观点是能读就尽量读,当然你是不是一定要去考这个学位,每个人根据自己的情况来定。其实读了之后不仅你在技术上有更好的功底,可能市场会给你更多的机会。我有时候说开心都好,你做哪些事情会让你获得长久的开心,这个可以考虑一下。
学长寄语
SJTU

希望同学们能持续学习,拓展格局,不断进步!