re从零开始异世界...吧 关注:351,207贴子:4,019,096

Re:从零开始的做爱蜜莉雅碳的AI生活

只看楼主收藏回复

喜欢艾米莉亚碳(我还是喜欢这个音译)很久了,打算做一个她的AI,在这个帖子里记录一下过程。也不一定能坚持下去,但还是记录一下吧。


IP属地:天津来自Android客户端1楼2024-01-30 14:44回复
    其实这个想法昨天就开始了,起源于我在微信公众号上看见一个高中生复现他很喜欢的一个AI。他是爬去那个AI的直播,然后用这些数据微调llama-2实现的。我一想,re0小说和动漫里有大量的emt的对话,所以说我可以利用这些对话微调ChatGLM3-6B实现。


    IP属地:天津来自Android客户端2楼2024-01-30 14:48
    回复
      微调完的模型预计不会开源(我怕长月老贼和白狐社找我麻烦),如果我真的完成了,谁想要可以免费私发


      IP属地:天津来自Android客户端3楼2024-01-30 14:50
      回复
        加油喵


        IP属地:广东来自Android客户端5楼2024-01-30 18:45
        回复
          昨天尝试用文心一言把对话提取出来,但文心一言似乎不知道什么叫“对话”然后又用ChatGPT 3.5,只提取出来几十句。现在得想别的办法了。


          IP属地:天津来自Android客户端6楼2024-01-30 20:15
          回复
            4060显存不够,打算买4060ti 16G


            IP属地:天津来自Android客户端8楼2024-01-30 20:17
            回复
              在GitHub上发现了这个:网页链接
              GPL协议,所以我似乎不用自己写代码了。反正我只是微调出来的模型不开源,主体代码还是打算开源的。


              IP属地:天津来自Android客户端9楼2024-01-31 16:07
              回复
                大佬加油捏


                IP属地:四川来自Android客户端10楼2024-02-01 03:28
                回复
                  显卡今天就要到啦!
                  目前的思路是用声纹识别软件识别出来re0动画里emt的所有语音所在的片段,然后从对应的srt字幕文件里面去找。


                  IP属地:天津来自Android客户端11楼2024-02-02 12:54
                  回复
                    楼主回来更新啦!(虽然没人看)
                    又想了想,AI提取对话的方案并不完全不可行,很有可能是因为ChatGPT的上下文窗口不够长导致的。因此决定动手修改那个调用ChatGPT提取上下文对话的脚本。


                    IP属地:天津来自Android客户端12楼2024-02-04 10:37
                    收起回复
                      提取出来了prompt,打算自己动手写脚本。


                      IP属地:天津来自Android客户端13楼2024-02-04 10:42
                      回复

                        额,彻底失败了


                        IP属地:天津14楼2024-02-04 11:41
                        回复
                          我还是不死心决定要用AI,结果……
                          AI们都是那啥!
                          我尝试了ChatGPT,百川,文心一言,ChatGLM-4等等,把不是对话的部分写成对话,把对话写错人名,……


                          IP属地:天津来自Android客户端15楼2024-02-07 15:25
                          回复
                            似乎只有手动标注数据一条路可走了……然而对我来说重看小说非常痛苦的一件事……


                            IP属地:天津来自Android客户端16楼2024-02-07 15:26
                            回复
                              最后,用ChatGPT标注数据成功啦!
                              然而训练出的AI远远没有我想象中的效果好……一通胡言乱语……我甚至不好意思拿出来给各位看……


                              IP属地:天津来自Android客户端17楼2024-02-08 14:06
                              回复