网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
02月22日
漏签
0
天
python吧
关注:
481,464
贴子:
1,985,458
看贴
图片
吧主推荐
视频
游戏
1
2
下一页
尾页
42
回复贴,共
2
页
,跳到
页
确定
<<返回python吧
>0< 加载中...
lstm纠正错别字模型。
只看楼主
收藏
回复
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
从零开始训练,可以识别常见的“的地得”,“做/作”,“在/再”。
训练数据有一半来源于我写的小说,另一半来源于聊天、人工编写,其他来源等。
目的是快速检查自己小说的错误,一个字一个字看太慢了,于是自己训练一个。
代码是AI写的,数据都是自己的,目前效果不错,大部分都能改对。
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
未来可能会扩展其他错别字。
2026-02-22 06:03:50
广告
不感兴趣
开通SVIP免广告
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不是预训练模型,从零开始的,用了2000多条文本数据,模型比较小,所以在手机上训练也很快。未来随着数据增多会扩大。
sunruisunrui
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
你这种需求,直接用最小的开源的大模型就可以了。0.6B 的就可以。
DogeCN
进士
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
牛,源码、数据和模型在手比那些语言大模型实在多了
我有罪请惩罚我吧
进士
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
其实可以用小模型还有预训练权重重新加权训练,让ai帮你调数据集,参数,写gui之类的。ai给的网络特别阉割
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
其实也是我对训练模型感兴趣哈哈哈,所以没想找开源的,谢谢大家的建议。
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
回应一下大家说的小模型训练,大家说的都有道理,但我觉得不太可行。因为生成式模型终究不能检查每一个关键字,而且生成的时候还是一个字一个字的蹦出来。没有办法做到瞬间就检查所有字而且还把修改后的全文发我。
判别式模型把每一个修改的地方都写出来,然后再把改后的完整小说贴出来,整个过程也就1秒。语言模型没办法比。而且我之前也试过大模型改错别字,缺点就是慢,而且会漏字,我才转而自己训练的。
2026-02-22 05:57:50
广告
不感兴趣
开通SVIP免广告
接受的教育不允许这样
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
纽币!!!!
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
放一个训练日志。
数据比较少,再加上任务比较简单,所以模型训练几轮就收敛了。
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
另外大家说的那个关于小模型微调的建议我也看了,确实效果很不错,但是要分段输入,而且时间比较长。
因为我写小说我犯的错误也就那么一两个,所以需要高度个人化。小模型的速度与性能不符合我的需求。另外也有漏字的可能。
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
表现得最好的一版,验证损失和准确率降到最低。
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
任务太局部了,换成gru。速度更快,且表现几乎一样
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
加入了门控机制和平滑,门控对损失贡献的权重是0.2左右,可以让模型还能学到该不该改。误改率降低,准确率提升。
2026-02-22 05:51:50
广告
不感兴趣
开通SVIP免广告
阿布阿奇
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
利用无障碍功能创建了一个悬浮窗,点击按钮就可以把打出的字快速修改,响应速度在毫秒级。实用性加了不少。
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示