当前位置: 首页 > news >正文

一个人做网站可以做什么华为应用市场下载安装

一个人做网站可以做什么,华为应用市场下载安装,wordpress 迁移 hexo,韩国原生ip站群服务器什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新#xff0c;从而减少适配下游任务所需要训练的参数。 环境准备 这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码#xff0c;少量修改就可使用。 …什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新从而减少适配下游任务所需要训练的参数。 环境准备 这次使用到的微调框架是llama-factory。这个框架集成了对多种模型进行各种训练的代码少量修改就可使用。 我是在昇腾上使用docker安装的装 Ascend CANN Toolkit and Kernels已经提前装好了如果没有的话需要另外安装 然后安装llama-factory git clone https://gitee.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e .[torch-npu,metrics]要是缺什么再pi install 来安装。 准备数据 LLaMA Factory工程目录的data目录下有已经有各种实例数据集了仿照格式自己做一个就行。比如alpaca格式如下必须有instruction、output2个字段 [{instruction: 人类指令必填,input: 人类输入选填,output: 模型回答必填,system: 系统提示词选填,history: [[第一轮指令选填, 第一轮回答选填],[第二轮指令选填, 第二轮回答选填]]} ]比如 [{instruction: 识别并解释给定列表中的两个科学理论细胞理论和日心说。,input: ,output: 细胞理论是生物科学的一个理论它认为所有生命体都是由微小的基本单元——细胞所构成。这是生物学的一个基础理论认为细胞是所有生物的基本结构和功能单位所有的生物都是由一个或多个细胞组成细胞只能通过细胞分裂产生新的细胞。这一理论由薛定谔、施瓦内和雪莱于1839年首次提出。\n\n日心说是指太阳是太阳系的中心也就是说行星围绕太阳旋转的理论。这个理论打破了传统的地心说观点认为地球并不是宇宙的中心。日心说的提出者是尼古拉·哥白尼他在16世纪初发表了他的著作《天体运行论》阐述了太阳系行星围绕太阳运行的模型为天文学的发展做出了巨大贡献。},{instruction: 输入三支篮球队的名称并生成一个适当的口号。,input: 输入俄克拉荷马城雷霆队芝加哥公牛队布鲁克林网队。,output: 输出 \雷霆公牛和网队各显神通角逐群雄!\},{instruction: 比较以下两位著名人物使用特征列表并以句子形式提供输出。,input: 人物1阿尔伯特·爱因斯坦\n人物2斯蒂芬·霍金\n特征智力、教育、对世界的影响,output: 阿尔伯特·爱因斯坦和斯蒂芬·霍金都是拥有极其出色智力的人物。两人都取得过非常高的教育成就他们推进了科学发展并在世界范围内产生了深远的影响。爱因斯坦以其相对论和质能关系公式而闻名而霍金以其关于黑洞和宇宙的发现而著称。两位科学家都以其深厚的学识和非凡的贡献影响了世界。},{instruction: 请根据以下文章构建一个需要回答的问题。,input: ,output: 我不好意思您没有提供任何信息或文章来供我根据它构建问题。 请提供相应的文章或信息以便我能够帮助您构建问题。} ]将训练数据集文件放到llama-factory工程下的data目录下然后修改data/dataset_info.json文件增加数据集的入口和目录如果我们在data下放了一个alpaca_zh_demo.json文件则要增加的内容如下 修改训练任务的配置文件 在examples\lora_multi_npu\目录下新建一个配置文件可以从已有的文件拷贝过去修改。比如 我新建的文件叫baichuan2_lora_sft_ds.yaml内容如下 ### model model_name_or_path: /home/xxxx/Baichuan2-13B-Chat/#/home/mindformer_share/baichuan-inc/Baichuan2-13B-Chat/### method stage: sft do_train: true finetuning_type: lora lora_target: all### ddp ddp_timeout: 180000000 deepspeed: examples/deepspeed/ds_z0_config.json### dataset dataset: summary_data_lora template: baichuan2 cutoff_len: 1024 max_samples: 1000 overwrite_cache: true preprocessing_num_workers: 16### output output_dir: saves/Baichuan2-13B-lora-checkpoint logging_steps: 10 save_steps: 500 plot_loss: true overwrite_output_dir: true### train per_device_train_batch_size: 1 gradient_accumulation_steps: 2 learning_rate: 1.0e-4 num_train_epochs: 5.0 lr_scheduler_type: cosine warmup_ratio: 0.1 fp16: true### eval val_size: 0.1 per_device_eval_batch_size: 1 eval_strategy: steps eval_steps: 500需要修改的几个字段如下 模型目录model_name_or_path输出目录output_dir训练轮数num_train_epochs使用的数据集名称也就是在dataset_info.json增加的数据集入口dataset模型架构constants.py文件中有所有支持的模型架构名称template 其它参数可以看自己需要来修改。 执行训练命令 上面已经准备了数据集也新增了训练的配置文件下面就可以执行训练命令 ASCEND_RT_VISIBLE_DEVICES0,1,2,3 llamafactory-cli train examples/lora_multi_npu/baichuan2_lora_sft_ds.yaml用到几张显卡在ASCEND_RT_VISIBLE_DEVICES后面指定就好了。 训练执行完毕在baichuan2_lora_sft_ds.yaml的out配置的目录下回生成训练好的lora模型 如何使用lora训练的模型 参考我前面一篇博客《在昇腾开发环境合并baichuan2-13B模型的lora文件》 参考资料 什么是指令微调LLM LLaMA-Factory
http://www.ho-use.cn/article/10815440.html

相关文章:

  • 免费刷推广链接的网站做网站用什么程序
  • 西安市地铁建设指挥部网站怎么做百度推广
  • 惠州做网站公司做微商怎么找客源加人
  • 网站在哪里备案桂城网站建设费用
  • 建设工程造价员网站WordPress文章搜索cpu飙升
  • 中国十大电商做的好的网站北京做视觉网站
  • 自己建设网站服务器云主机可以做网站吗
  • 阿里云建站售前咨询郑州+高端网站建设
  • 长沙精品网站建设公司网络营销推广方法选择
  • 学校网站建设的意见买了域名不备案行吗
  • 公司注册网站源码网站建设需要交文化建设税吗
  • 海珠一站式网站建设简约创意情人节海报设计
  • 企业网站多大空间汉南公司网站建设
  • 公司网站建设如何撤销企业系统建设
  • 做网站做什么公司好旅行社营业网点可以做网站吗
  • 鲜花网站建设的主要工作流程北京市官方网站
  • google adwords建站优化易下拉系统
  • 网站建设有没有做的必要性交互式网站是什么
  • 营销型网站建设市场美工培训电商设计培训班
  • 科创纵横 网站建设搜狗推广后台登录
  • 健康类网站模板提高网站知名度
  • 上海网络平台网站网络维护合同范本
  • 网站后台管理系统怎么用网站制作价
  • 广州网站建设公司小程序广东省建设职业注册中心网站
  • 洛阳网站建设哪家权威网站建设html5模板
  • 零食销售网站开发与设计wordpress 如何用
  • 网站建设与用户体验网站建设中单页面
  • 网站如何添加浮动窗口wordpress下单邮件通知
  • 开发一个电商网站佛山建设网站制作
  • 做百度网站排名软件做购物网站的图标从哪里来