网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
02月22日漏签0天
python吧 关注:481,464贴子:1,985,458
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 1 2 下一页 尾页
  • 42回复贴,共2页
  • ,跳到 页  
<<返回python吧
>0< 加载中...

lstm纠正错别字模型。

  • 只看楼主
  • 收藏

  • 回复
  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
从零开始训练,可以识别常见的“的地得”,“做/作”,“在/再”。
训练数据有一半来源于我写的小说,另一半来源于聊天、人工编写,其他来源等。
目的是快速检查自己小说的错误,一个字一个字看太慢了,于是自己训练一个。
代码是AI写的,数据都是自己的,目前效果不错,大部分都能改对。


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
未来可能会扩展其他错别字。


2026-02-22 06:03:50
广告
不感兴趣
开通SVIP免广告
  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
不是预训练模型,从零开始的,用了2000多条文本数据,模型比较小,所以在手机上训练也很快。未来随着数据增多会扩大。


  • sunruisunrui
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
你这种需求,直接用最小的开源的大模型就可以了。0.6B 的就可以。


  • DogeCN
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
牛,源码、数据和模型在手比那些语言大模型实在多了


  • 我有罪请惩罚我吧
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
其实可以用小模型还有预训练权重重新加权训练,让ai帮你调数据集,参数,写gui之类的。ai给的网络特别阉割


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
其实也是我对训练模型感兴趣哈哈哈,所以没想找开源的,谢谢大家的建议。


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
回应一下大家说的小模型训练,大家说的都有道理,但我觉得不太可行。因为生成式模型终究不能检查每一个关键字,而且生成的时候还是一个字一个字的蹦出来。没有办法做到瞬间就检查所有字而且还把修改后的全文发我。
判别式模型把每一个修改的地方都写出来,然后再把改后的完整小说贴出来,整个过程也就1秒。语言模型没办法比。而且我之前也试过大模型改错别字,缺点就是慢,而且会漏字,我才转而自己训练的。


2026-02-22 05:57:50
广告
不感兴趣
开通SVIP免广告
  • 接受的教育不允许这样
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
纽币!!!!


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
放一个训练日志。
数据比较少,再加上任务比较简单,所以模型训练几轮就收敛了。


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
另外大家说的那个关于小模型微调的建议我也看了,确实效果很不错,但是要分段输入,而且时间比较长。
因为我写小说我犯的错误也就那么一两个,所以需要高度个人化。小模型的速度与性能不符合我的需求。另外也有漏字的可能。


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
表现得最好的一版,验证损失和准确率降到最低。


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
任务太局部了,换成gru。速度更快,且表现几乎一样


  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
加入了门控机制和平滑,门控对损失贡献的权重是0.2左右,可以让模型还能学到该不该改。误改率降低,准确率提升。



2026-02-22 05:51:50
广告
不感兴趣
开通SVIP免广告
  • 阿布阿奇
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
利用无障碍功能创建了一个悬浮窗,点击按钮就可以把打出的字快速修改,响应速度在毫秒级。实用性加了不少。


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 1 2 下一页 尾页
  • 42回复贴,共2页
  • ,跳到 页  
<<返回python吧
分享到:
©2026 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示