当前位置: 首页 > news >正文

重庆模板建站公司福州seo服务商

重庆模板建站公司,福州seo服务商,旅游景区网站建设策划书,wordpress延迟加载背景#xff1a; 我们在用chatGPT或者SD的时候#xff0c;发现如果使用英语写提示词得到的结果比我们使用中文得到的结果要好很多#xff0c;为什么呢#xff1f;这其中就有一个叫做tokenizer的东西在作怪。 训练一个合适的tokenizer是训练大模型的基础#xff0c;我们既…背景 我们在用chatGPT或者SD的时候发现如果使用英语写提示词得到的结果比我们使用中文得到的结果要好很多为什么呢这其中就有一个叫做tokenizer的东西在作怪。 训练一个合适的tokenizer是训练大模型的基础我们既可以从头开始训练一个全新的tokenizer也可以利用旧的tokenizer训练出一个新的来今天就让我们看看如何来以旧换新。 第一步数据准备 不管是训练大模型还是训练tokenizer首先都需要我们准备数据集 from datasets import load_dataset #加载数据集 raw_datasets load_dataset(code_search_net, python)#写一个迭代函数分配加载数据防止数据集太大导致内存溢出 def get_training_corpus():return (raw_datasets[train][i : i 1000][whole_func_string]for i in range(0, len(raw_datasets[train]), 1000))training_corpus get_training_corpus() 第二步训练 #加载旧的tokenizer old_tokenizer AutoTokenizer.from_pretrained(gpt2) #进行训练 tokenizer old_tokenizer.train_new_from_iterator(training_corpus, 52000)第三步保存 tokenizer.save_pretrained(code-search-net-tokenizer) 第四步使用 tokenizer AutoTokenizer.from_pretrained(huggingface-course/code-search-net-tokenizer) 总结 1、利用AutoTokenizer.train_new_from_iterator()可以很轻松的使用我们自己的数据集来根据旧的tokenizer来训练出一个全新的tokenizer 2、如果我们需要的语言中没有可用的大语言模型或者我们要预测的数据集与我们选择的大语言模型训练的数据集非常不同我们就需要使用适合我们的数据的tokenizer从头开始重新训练模型。
http://www.ho-use.cn/article/10817508.html

相关文章:

  • qq邮箱官方网站wordpress 腾讯课堂
  • 上海普陀网站建设网站开发好公司
  • 昆明 网站搭建html可视化编辑软件
  • 网站浮动代码心雨在线高端网站建设网页设计
  • 上海网站制作哪家好网络推广龙岗比较好的
  • 河北响应式网站建设easy wordpress timelines
  • 成都网站快照优化公司推广普通话的标语
  • 公司做网站的优点10个好用的wordpress投票_评分插件
  • 济南网站定制策划做的精美的门户网站推荐
  • 在什么网站做兼职翻译怎么用flash做游戏下载网站
  • 房地产网站建设背景企点app下载
  • 做网站外包公司有哪些网站建设富库
  • 任县网站建设多少钱绩溪住房建设网站
  • 母婴微网站设计规划wordpress主题siren
  • iis部署网站提示建设中wordpress恢复小工具
  • 手机网站策划书方案域名备案要多少钱
  • 网站优化图片链接怎么做着陆页制作网站
  • 铜川商城网站建设简单建站的网站
  • 网站建设与推广销售户话术甘肃古典建设集团有限公司网站
  • 怎样做网站挣钱网站建设快速便宜
  • 网站空间购买多少钱百度站长工具网站验证
  • 沧浪网站建设方案seo顾问达人
  • 兴义市网站建设wordpress音乐musik
  • h5网站开发培训哪里好网站开发 土木
  • net网站开发设计配色网站
  • 送网站建设管理信息内容审核制度嘉兴快速建站模板
  • 怎么做公司网站的二维码俄罗斯搜索引擎浏览器官网入口
  • linux 网站开发百度网盟推广组所拥有的定向功能
  • html5网站演示php做购物网站详情页的代码
  • 游戏网站搭建需要多少钱竞价推广是什么工作