有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
您好,欢迎光临陕西某某伟业体育文化传播有限公司网站!
有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
网站首页/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司/ CUDA真是NVIDIA绝对牢不可破的生态吗?_浙江省台州市三门县煤淡露触床上用品有限责任公司
版权@|备案:粤IP*******|网站地图
电话:15319955858 029-87375858咨询微信:admin-2016
地址:西安市莲湖区西大街宏府安定广场4号楼581室
备案号: 技术支持:模板星
公司专业从事青少年足球培训,欢迎前来咨询!