登录
主页
跨站公共时间轴
本地时间轴
关于
推文详情
已过滤: .
继续显示
Leo Xiang
leeoxiang@x.good.news ·
@leeoxiang@x.good.news
livekit 引入了利用大模型来来做轮次检测,解决AI对话中的误打断,比基于人声的VAD 准确度提高很多,非常有意思的尝试。 技术细节: 1、基于 一个 135M的模型(SmolLM2-135M)微调而来,量化之后CPU上就能跑。 2、将意外打断减少了85%,仅有3%的情况下错误地判断对话未结束。
t.co/1JDNLlNEdp
查看详情
0
0
0
@leeoxiang@x.good.news
0/477
评论
加载中