当前位置:中国杭州网 » 产业 » 科技 » 正文

AI要说正宗杭州话 紧急招募“老杭州”

2026-02-13 11:57:35 来源:杭州日报

想象一下,大伯大妈和机器人用杭州话谈天说地,年轻人“一键生成”杭州话说唱,小伢儿捧着杭州话AI“从早间头话到夜到头(杭州方言:从早说到晚)”,这是什么魔幻场景?

其实,AI距离会说正宗杭州话,只差“临门一脚”了!由浙江大学文学院、阿里巴巴AI Data团队牵头,浙大城市学院杭州语言服务协同创新研究中心协办的“杭州方言系统化采集工程”正在紧锣密鼓进行中。

AI看似无所不能,但让它学会说杭州话,其实是有难度的。这和杭州方言的特殊性有关。

“95后”杭州方言研究者高任飞是本次项目的主要参与者之一。他介绍,杭州话(杭州小片)属于汉语族下的吴语太湖片区,难就难在杭州话保留了古汉语中的清浊音、入声等语音特征,足有7个声调,甚至杭州话在连读时还会“再变调”,比如“西、湖”和“我到西湖”,“西、湖”两字的声调就不同。

“如果没有广大杭州市民动嘴录下来的数据支撑,AI说杭州话,只会说得一口‘洋泾浜’(指语言不规范)。”

目前,“杭州方言系统化采集工程”发出征集令,只要符合以下条件:自幼大部分时间生活在杭州老城区;能说一口自然、地道的杭州话,就可以加入杭州话AI的打造工程。

这个借助高科技的语言采集项目,更深层的含义是杭州方言的传承和保护。

“在杭州老城区,能流利说地道杭州话的人越来越少。年轻一代中,能自然用杭州话交流的,更是寥寥。承载历史记忆的杭州话,正面临传承的危机。我们不想让这份独一无二的声音,就这样沉默下去。”高任飞表示。

“只要你愿意为家乡话出一份力,我们都真诚欢迎你加入。加入方式很简单,用手机录制你朗读的杭州话,我们会提供简短文本,你用自然语速朗读即可。录音时长也自由安排,10分钟也好,几个小时也行。你的每句地道发音,都将被永久保存,进入杭州方言高质量数据库,成为未来研究、技术训练、文化传承的珍贵原料。对参与录音的志愿者,我们还将支付一定报酬。”

本次杭州方言采集主要针对杭州老城区及西湖周边龙井、梅家坞一带的方言,余杭、萧山、彭埠、转塘等地方言暂不纳入。2月13日起,市民可以用手机登录网站报名,并完成小测试。

“这个测试主要看你的杭州话是否地道,能否轻松应对。比如请你用杭州话说:‘我清个老早爬起来,望横河桥嗰把儿里走过去。’”

杭州话AI模型何时出炉?“参加录音的人越多,语料越丰富,这个模型就能越快发布。”今后,杭州话AI模型可以生成大段的杭州话文本以及语音,面向各种场景,包括公共服务、学术研究、杭州话学习等。

“我们的愿景就是用现代科技,为杭州话留下一份真实、完整、鲜活的‘数字声音档案’,让乡音在人工智能时代,依然能被听见、被读懂、被传递。”高任飞说。

责任编辑:吴青
分享到:

相关推荐

杭州市解码拱墅首店“高浓度”

“GOAL SEASON”世界杯主题运动季在杭州中心启动。杭州中心开出FIFA官方授权世界杯快闪店。恒隆广场今年落地超80家首店。6月24日,2026年美加墨世界杯赛场上,41岁的C罗独中两元,对着镜头激动地喊出“I...【详细】

杭州日报拱墅区2026/06/26

杭州全国首创推出机动车电子登记信息

不少市民购置新车后,想尽快申报新车购车补贴,却苦于机动车登记证书(“大绿本”)需要邮寄过来,无法第一时间提交材料。近日,记者从杭州交警了解到,杭州车管所在“警察叔叔”APP上,全国首创推出机动车电子登记信息,有效提升...【详细】

每日商报民生2026/06/26

杭州市AIGC赋能正能量传播大会在滨江启动

当AIGC遇上好故事、好内容将会迸发出怎样的热度?6月25日晚,一场聚焦AIGC赋能正能量传播的大会在杭州高新区(滨江)电竞馆举行。作为杭州人工智能创新发展第一区,杭州市高新区(滨江)已形成涵盖算力、大模型、数字人、...【详细】

每日商报滨江区2026/06/26