从零开始的 AI Infra 学习之路

06-01 1545阅读

从零开始的 AI Infra 学习之路

文章目录

  • 从零开始的 AI Infra 学习之路
    • 一、概述
    • 二、AI 算法应用
      • 2.1 机器学习
      • 2.2 深度学习
      • 2.3 LLM
      • 三、AI 开发体系
        • 3.1 编程语言
        • 四、AI 训练框架 & 推理引擎
          • 4.1 PyTorch
          • 4.2 llama.cpp
          • 4.3 vLLM
          • 五、AI 编译 & 计算架构
            • 5.1 CUDA
            • 5.2 CANN
            • 六、AI 硬件 & 体系结构
              • 6.1 INVIDIA GPU
              • 6.2 Ascend NPU

                一、概述

                AI Infra(AI 基础设施)是指为上层的 AI 算法应用提供支持的 AI 全栈底层技术,通过合理利用计算机体系结构,可以实现 AI 计算的加速和部署。

                AI Infra 主要包括以下内容:

                • AI 训练框架 & 推理引擎;

                • AI 编译 & 计算架构;

                • AI 硬件 & 体系结构。

                  从零开始的 AI Infra 学习之路

                  参考资料:

                  • AI System (chenzomi12.github.io)
                  • GitHub - chenzomi12/AISystem: AISystem

                    二、AI 算法应用

                    2.1 机器学习

                    ……

                    2.2 深度学习

                    • 深度学习入门笔记:GitHub - shen-shanshan/cs-self-learning/09.AI/05.Deep_Learning/PyTorch/PyTorch_Tutorials/01.Notes
                    • One-Hot 编码:机器学习:数据预处理之独热编码(One-Hot)详解-CSDN博客
                    • 激活函数:机器学习中的数学——激活函数:基础知识_神经网络中激活函数的数学基础-CSDN博客

                      2.3 LLM

                      token:文本中最小的语义单元,如:单词、符号等(tokenization:分词)。

                      编码(encoding):将子词序列转换为数值向量。

                      解码(decoding):将每个数值编码替换成其对应的子词,然后将相邻的子词合并成最长的匹配单词,从而得到一个文本。

                      嵌入(embedding):子词 -> 特征向量,表示该子词的语义。基于互联网上大量的文本资料,统计出两个词语在相邻/句子/文章中共同出现的概率并通过权重来汇总计算,就能分析出某个词语与另外一个词语的亲密度的数值,并将这个数值作为特征向量来描述这个词语。通过嵌入,我们就可以把每个子词看作是高维空间中的一个点,而这些点之间的距离和方向,就可以表示出子词之间的相似度和差异度(词义相似时,在空间上也相近)。

                      预测(prediction):根据给定的文本,计算出下一个子词出现的概率。下一个子词出现概率的计算,就是基于特征向量表进行的。

                      小结:通过嵌入和预测,我们就可以实现从文本到数字,或者从数字到文本的转换。

                      训练 & 推理:

                      • 科普 | 深度学习训练和推理有何不同? - 知乎 (zhihu.com)
                      • 训练(training)和推理\推断(inference)的关系?_模型训练和推理的区别-CSDN博客

                        生成:指根据给定的文本来生成新的文本的过程。生成可以分为两种模式:自回归(autoregressive)和自编码(autoencoding),GPT 系列主要采用了自回归模式。

                        参考资料:

                        • 关于深度学习和大模型的基础认知 (huawei.com)
                        • 科普神文,一次性讲透AI大模型的核心概念 (qq.com)
                        • 解读AI大模型,从了解token开始 - 知乎 (zhihu.com)

                          Transformer:

                          • 【超详细】【原理篇&实战篇】一文读懂Transformer-CSDN博客
                          • The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

                            参考资料:

                            • von Neumann-CSDN博客
                            • Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

                              三、AI 开发体系

                              3.1 编程语言

                              • Python 学习笔记:GitHub - shen-shanshan/cs-self-learning/01.Languages/Python/01.Notes
                              • C++ 学习笔记:GitHub - shen-shanshan/cs-self-learning/01.Languages/C&C++/02.Notes

                                四、AI 训练框架 & 推理引擎

                                4.1 PyTorch

                                • 总览:Welcome to PyTorch Tutorials — PyTorch Tutorials 2.4.0+cu121 documentation
                                • 入门教程(old):Learning PyTorch with Examples — PyTorch Tutorials 2.4.0+cu121 documentation
                                • 入门教程(new):Learn the Basics — PyTorch Tutorials 2.4.0+cu121 documentation
                                • Tensor 常用操作:torch.Tensor详解和常用操作-CSDN博客

                                  4.2 llama.cpp

                                  ……

                                  4.3 vLLM

                                  • 官方文档:Welcome to vLLM!

                                    五、AI 编译 & 计算架构

                                    5.1 CUDA

                                    ……

                                    5.2 CANN

                                    • 开发文档:CANN社区版8.0.RC3.alpha001开发文档-昇腾社区 (hiascend.com)
                                    • 环境搭建:基于 EulerOS & Ascend NPU 搭建 PyTorch 远程开发环境-CSDN博客

                                      六、AI 硬件 & 体系结构

                                      6.1 INVIDIA GPU

                                      • GPU 架构学习笔记:INVIDIA GPU 架构 & CUDA 平台入门学习-CSDN博客

                                        6.2 Ascend NPU

                                        • NPU 架构学习笔记:Ascend NPU 架构 & CANN 平台入门学习-CSDN博客
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们。

相关阅读

目录[+]

取消
微信二维码
微信二维码
支付宝二维码