获取访问网站的qq,数据库营销,建材网站开发,儿童网站模板在上一篇文章中#xff0c;我们通过二次函数的例子#xff0c;讲解了如何训练人工智能。今天#xff0c;让我们进一步探讨#xff1a;面对不同的实际问题#xff0c;应该如何选择合适的函数形式#xff1f;
一、广告推荐系统中的函数选择
1. 业务目标
想象一下#x…在上一篇文章中我们通过二次函数的例子讲解了如何训练人工智能。今天让我们进一步探讨面对不同的实际问题应该如何选择合适的函数形式
一、广告推荐系统中的函数选择
1. 业务目标
想象一下你正在刷抖音突然看到一个运动鞋的广告。巧的是你最近正在对比各种跑鞋这个广告简直像是读懂了你的心这就是智能广告推荐系统的魔力。
广告推荐的核心目标是
向用户推送最适合的广告提高广告点击率最大化广告收益
2. 数据输入特征工程
A. 用户基础属性
人口统计学特征 年龄性别地理位置职业收入水平
# 用户基础属性示例
import pandas as pduser_base_features {user_id: [u001, u002, u003],age: [25, 35, 28],gender: [F, M, F],location: [北京, 上海, 广州],occupation: [学生, 工程师, 设计师]
}df_user pd.DataFrame(user_base_features)
print(用户基础特征示例)
print(df_user)B. 用户行为特征
历史互动数据 最近30天点击的品类最近7天的购买记录收藏的商品类型停留时长 C. 广告特征
广告属性 商品类别价格区间品牌信息广告创意类型图片/视频历史点击率
3. 函数选择Logistic回归LR
A. 为什么选择LR
输出范围在[0,1]之间完美契合概率预测计算速度快适合在线服务模型可解释性强
B. 函数形式
def logistic_function(x, weights):x: 输入特征向量weights: 模型权重返回: 点击概率z np.dot(x, weights)probability 1 / (1 np.exp(-z))return probabilityC. 实际应用示例 4. 函数输出
预测值用户点击广告的概率0~1之间的数值实际应用 概率 0.7优先推荐0.3 概率 0.7次优推荐概率 0.3不推荐 5. 效果评估
在线指标 CTR点击率CVR转化率ROI投资回报率 离线指标 AUCLog Loss 这样的广告推荐系统就像一个智能客服它通过分析用户的各种特征和行为预测用户对不同广告的兴趣程度从而实现精准推送既提升了用户体验也最大化了广告收益。
二、人脸识别中的函数选择
2.1 人脸识别要解决什么问题
想象你走进一个高科技大厦门禁系统的摄像头对准你的脸
0.1秒后门开了“张先生早上好”系统刚刚做了什么它解决了这个人是谁的问题
本质上人脸识别就是一个函数输入是一张人脸照片输出是这个人的身份。
2.2 输入人脸图像数据
2.2.1 原始输入
一张普通的人脸照片数据格式224×224×3的像素矩阵 224×224图片的宽和高3RGB三个颜色通道
2.2.2 输入预处理
就像你拍证件照时摄影师会要求你正对镜头、不要歪头一样原始照片需要标准化处理
人脸检测找到照片中的人脸区域人脸对齐调整人脸角度使其正对镜头尺寸统一缩放到224×224像素像素归一化将0-255的像素值转换为0-1之间
2.3 函数深度卷积神经网络CNN
2.3.1 CNN如何工作
想象你在认人时的过程
先看整体轮廓是胖是瘦再看局部特征眼睛大小、鼻子形状最后综合判断这是张三
CNN就是模仿这个过程的数学函数
卷积层提取局部特征眼睛、鼻子、嘴巴等池化层抓住重要特征眼睛很大、鼻子很挺等全连接层综合判断生成身份证特征向量
2.4 输出身份特征向量
2.4.1 特征向量
一个512维的数值数组每个数值代表一个抽象的人脸特征可以理解为人脸的数字指纹
2.4.2 身份判断
计算特征向量之间的相似度如果相似度超过阈值如0.8则认为是同一个人
2.5 整体流程总结
人脸识别 特征提取函数 相似度比较
输入224×224×3的人脸图片函数处理 CNN提取特征生成512维特征向量 输出 与数据库中的特征向量比较找到最相似的人脸返回身份信息
就像每个人的指纹都是独一无二的CNN会为每个人的脸生成独特的数字指纹通过比对这些指纹来识别身份。这就是人脸识别的核心原理
三、ChatGPT的函数又是什么
3.1 ChatGPT要解决什么问题
想象你在和一个无所不知的朋友聊天
“帮我写一个请假条”“解释下量子力学的基本原理”“给我的短篇小说提些修改建议”
ChatGPT就是要解决如何像人类一样理解和生成文本的问题。本质上它是一个复杂的函数输入是用户的问题或需求输出是连贯且符合上下文的回答。 3.2 输入文本序列
3.2.1 基本输入形式
自然语言文本可以包含多轮对话历史支持多种语言可以包含代码、数学公式等特殊格式 3.2.2 输入预处理
文本标准化分词Tokenization添加特殊标记如开始符、结束符转换为模型可理解的数字序列 3.3 函数Transformer架构
3.3.1 核心组件
注意力机制Attention理解单词之间的关系自注意力层捕捉上下文信息前馈神经网络处理特征转换
3.3.2 工作流程
输入编码将文本转换为向量多头注意力同时关注多个特征维度特征处理通过多层转换提取深层特征输出生成逐个生成输出词汇
3.4 输出生成的文本序列
3.4.1 输出形式
自然语言回答代码片段创意写作格式化文档
3.4.2 输出特点
上下文连贯性语法正确性逻辑合理性风格一致性
3.5 整体流程总结
ChatGPT 超级语言理解函数 智能文本生成器 输入处理 用户输入文本分词和编码添加位置编码 函数处理 注意力计算上下文理解特征提取知识应用 输出生成 词语概率预测序列解码文本生成
ChatGPT就像一个超级对话助手它通过复杂的Transformer架构将我们的输入文本转化为有意义的回答。这个过程就像是一个超级翻译官不仅要理解我们说什么还要用最恰当的方式回答我们的问题
总结
选择合适的函数形式是AI工程中的关键步骤。我们需要
深入理解问题本质权衡不同模型特点考虑工程实现约束
记住没有最好的函数形式只有最适合的选择
参考资料
[1] 推荐系统中的CTR预估模型详解 (https://zhuanlan.zhihu.com/p/35465875). 知乎专栏.
[2] 特征工程从理论到实践 (https://zhuanlan.zhihu.com/p/105912713). 知乎专栏.
[3] Logistic回归原理与应用 (https://blog.csdn.net/qq_22210253/article/details/104452244). CSDN博客.
[4] Logistic回归的直观理解与实现 (https://zhuanlan.zhihu.com/p/111725866). 知乎专栏.
[5] 广告推荐系统中的机器学习模型 (https://www.jianshu.com/p/5a6e5e7b0d7c). 简书.
[6] 推荐系统性能评估指标详解 (https://blog.csdn.net/wangweiwei1992/article/details/103724165). CSDN博客.
[7] 人脸识别技术综述 (https://zhuanlan.zhihu.com/p/144576990). 知乎专栏.
[8] 深度学习中的图像预处理 (https://zhuanlan.zhihu.com/p/49785817). 知乎专栏.
[9] 人脸检测与对齐技术解析 (https://blog.csdn.net/qq_34337272/article/details/103005027). CSDN博客.
[10] 卷积神经网络CNN的原理与应用 (https://zhuanlan.zhihu.com/p/37065752). 知乎专栏.
[11] 深度学习在身份识别中的应用 (https://blog.csdn.net/qq_43557591/article/details/113302566). CSDN博客.
[12] 人脸识别中的特征向量与相似度计算 (https://zhuanlan.zhihu.com/p/34267502). 知乎专栏.
[13] ChatGPT从原理到应用 (https://zhuanlan.zhihu.com/p/588257865). 知乎专栏.
[14] NLP中的文本预处理技术详解 (https://zhuanlan.zhihu.com/p/101264285). 知乎专栏.
[15] 图解Transformer注意力机制的核心 (https://jalammar.github.io/illustrated-transformer/). Jalammar博客.
[16] Transformer在NLP中的应用 (https://zhuanlan.zhihu.com/p/54503186). 知乎专栏.
[17] GPT模型的文本生成原理 (https://zhuanlan.zhihu.com/p/484713322). 知乎专栏. 下期预告我们将深入探讨如何训练这些不同形式的函数。敬请期待