发布日期:2025-02-16 08:26 点击次数:203
全球东谈主民翘首以盼,终于在上个周末九游会J9,把的翻译功能盼来了!
一些翻开样貌和应知如下:
升级到最新版块
尝试修改我方的谈话设立,包括小红书设立和手机系统设立
目下只营救单一谈话的翻译,要是是中英羼杂,或者带多情态包,不可奏凯触发
照旧没反映的话,有网友提议了「杀后台大法」:褒贬区苟且发一句英文,然后退出后台,再再行翻开小红书,就会出现翻译功能
本文截图来自小红书用户,用户名如图所示,下同
太快了,小红书你有手速这样快的步伐员参加公司,tt 用户示意,从来没见过速率这样快的更新,这便是别传中的中国速率吗?
全宇宙东谈主民齐很快活,除了有谈辞书。
诚然短短一周时代就上线,但翻译的阐发罕见的好,这下跨国冲浪的确如有神助。
什么 u1s1 啦,yyds 啦,cpdd 啦,这些基于拼音的缩写裕如能准确浮现,何况标注出来。
有一说一,近邻共事示意她齐不知谈 cpdd 是什么道理——东谈主类不如 GPT 的又一铁证。
小红书你到底是在作念翻译照旧在作念梗百科!
这一波的格外弃世是,趁便把方言也给翻译了。
以致要是原文中有不实,不仅不会影响翻译,小红书还会贴心注解好。
你是真是为了我学英语在探求,泪目。
很彰着,此次小红书翻译功能的背后有着 大谈话模子的营救,网友们迫不足待地开动了对背后模子的调戏。
比如先淡淡作念个翻译,然后写几行诗。
还有淡淡作念个翻译之后,转头一下今天的新闻。
以致还有打出一串摩斯电码让它翻译的——这里是小红书,不是《风声》啊。
片面书记:当今最强的多功能翻译软件是小红书。
大谈话模子措置翻译任务,诚然依然很好使了,然则落在小红书这样践诺无比丰富的社交平台上,照旧有许多挑战。
谈话的种种性便是最具有挑战性的。一些文化特定的术语、民俗抒发或比方,如谚语、俚语,难以准确翻译。
还有一些东谈主名、昵称,模子可能无法很好地分袂哪些词需要翻译,哪些词需要保留。
比如这里的「orange man」顺利译成了「橙东谈主」,其实这里指的是特朗普。
在准确性除外,普通用户比较难感知到的是翻译所需要的野心资源。
在小红书这样践诺相配丰富的平台上,用户可能只发几个字母,也可能长至几百字的条记。比较之下,长践诺的翻译会占用更多资源,增多系统负载。
同期,各个国度的用户齐进驻之后,时区溜达普通,导致系统的确莫得低负载时代。
比及双方齐睡醒了,短短的时区重合区间内,翻译央求量可能陡然激增,系统需要在短时代内措置渊博并发央求,对并发措置才调是很大的考验。
预判异日,小红书这波在大气层
当今还莫得准确的音问指出新的翻译功能背后,到底调用的是什么模子。在一些网友的「逼问」之下,似乎是 GPT。
还有的网友「逼问」出来是智谱。
抛开幻觉不谈,考 虑到老本问题,还真不好说用的是什么。 GPT 参数目大,野心老本高,不适合部署在资源受限的环境中。
比较可行的一种政策,是选拔一个学生模子,并把 GPT 算作老到模子进行 蒸馏。学生模子普通参数目更少,推理速率更快,但尽量保留老到模子的才调。
恰好,这种阶梯关于小红书而言,简略更有主理。
小红书对大谈话模子、多模态等 AI 时代的探索,早就开动了,仅仅一直侧重于算法优化。也曾也作念过一些小小的 AI 功能,咱们之前写过不少。
很少东谈主知谈的是,在 2024 年年头的 AAAI 上,小红书的搜索算法团队,就针对大模子蒸馏提议过一个新想路。
这是一个全新框架, 在蒸馏大模子推理才调的历程中充分哄骗负样本学问。
「负样本」是一个很兴味的成见。传统蒸馏一般只关爱正样本,这并不难瓦解:训诫指示生,确定是教正确的解题样貌,让学生去瓦解和师法。
不外,全球上学时确定也有作念过「错题集」,把我方犯过的错、掌持得不够牢的场所纪录下来。 这些错题便是「负样本」,在小红书的褒贬区,那些不够准确的翻译,便是负样本。
比如底下这个「fair point」,是在翻译功能上线之前,这个译文就太机翻了。在这个褒贬区里,翻译成「有兴味」更合适。
就像「错题」里也包含着贫乏的信息通常, 「负样本」能够匡助学生模子识别哪些臆想是不正确的,增强其辩认才调、耕作对困难样本的措置,同期能够在复杂的谈话抒发中,保持一致性。
打个比方,当今你想要和异邦友东谈主们褒贬区对线——啊不,对账——一些答理干系的词语可能会出现。
比如银行 bank 这个词可能会每每出现,但它还有别的道理:「河床」,同期它还不错算作动词使用。
通过负样本学习,便是在测验模子识别多义抒发,纠正翻译逻辑,生成更当然的践诺。
负样本的上风还体当今对小语种的营救。要知谈,此次不仅仅好意思国用户,还有全球各个场所的用户齐涌上来:塞尔维亚、秘鲁,澳洲某些地区的原住民。
通过哄骗负样本(包括翻译不实的常见景观),学生模子能够识别并遮掩高频不实,耕作低资源谈话的翻译才调。
小红书团队提议的这个框架, 是一种对蒸馏的革命应用,那时是为了从大谈话模子中索求复杂推理的才调并移动到专科化小模子当中。至于具体不错完成什么任务那时并不明晰,起码看上去,翻译并不是要点。
那时简略没东谈主知谈这个框架,在一年之后,会为小红书成为国社相通的桥梁带来匡助。
照旧那句老话:契机长久留给有准备的东谈主。
Powered by 九游娱乐(China)官方网站 @2013-2022 RSS地图 HTML地图