博客复更

Posted by Max on April 6, 2020

I. 关于停更

大家好,好久不见!因为去年换了工作,接到的第一个AI加速器项目时间很紧,几个人从前端架构干到前仿结束,上个月终于提交送Tapout了。期间压力很大,基本没有个人时间,所以博客也就停更了。最近,项目文档和专利差不多也写完了,终于有了些个人时间,所以准备继续更新博客,但对于后续更新内容要简单说明一下。

II. 关于NVDLA

和NVDLA有关的几篇文章是很多人来到这个博客的主要原因,所以需要单独说说。中间一年虽然没更新博客文章,但回答了一些小伙伴碰到的问题,还跑去官网看了一下软硬件代码,发现软件和硬件代码都有更新,和我做映射时的代码有不少区别,所以使用新版本代码参照博客里NVDLA的映射流程会跑不通,所以,现有文章只能做参考,有些问题可能需要去官方仓库提Issue。另外,

  • 博主暂时应该不会用新代码重新跑一遍流程,因为换了工作,手上没有FPGA开发板玩了,关键是没这个需求;
  • 关于代码分析的文章应该暂时也不会添加,放下太久,重新捡起要花比较大精力,但后续有时间会再看,NVDLA源码印象比较深的是Skid BufferShannon Decomposition在源码里用到的非常多,前者在源码分析文章里有过介绍,后者实际也是一种面积换效率的技术,NVDLA本身就是和NV GPU打包在服务器上用的,所以面积和功耗不是问题,感兴趣的可以了解一下。

III. 后期更新内容

后续更新的内容基本是工作和博主个人感兴趣的一些东西,包括

  • NOC内部结构与分析对比. 这东西应该是现在做SoC必须要了解掌握的吧,Intel收了NetSpeed,Facebook去年又收了Sonics,现在应该只有Arteris是自由身吧;
  • DSL和IP自动生成器. 这里的DSL是公司一大牛搞的Coffee HDL ,和Chisel,SpinalHDL这些差不多都是写IP生成器的,只是特性上有点区别,目前公司内部项目上在使用。IP自动生成器是在DSL基础上又向上抽象了一层,希望将IP-based SoC设计方法下沉到IP内部设计,管理定制IP自动生成的一套框架和方法;要知道GEMM不仅可以用在AI加速器,传统的语音、图像、通信基带数字信号处理也应用颇多。目前在做自动生成器的架构定义和可行性验证,后期会分享部分生成实例;
  • 数字IP. 可能会有立体视觉与加密的部分分享。

这些是目前有打算做的,工作量都不小,有阶段性输出时,会适时分享。 :cowboy_hat_face:


===Tips====

博主之前有写技术总结的习惯,但一直没想写博客,一是因为要对博客内容不断的QA,做知识单向输出,而鲜有Communication,再一个是时间成本回报,写这些不赚钱,不得名,时间成本还不低,坚持下去的动力为何?后来之所以写,是因为一个AI处理器设计讨论群中有不少群友有了解FPGA实现NVDLA映射的需求,刚好我又刚做完,所以开了这个博客。既然开了,就准备维护下去,技术放在印象笔记里是提醒自己避坑,放在这里可以给更多人参考,也是个收获了。扯了这么多,想说,博客维护我会分配固定时间,有问题直接放到博客评论或邮箱,可能回复不及时,但会抽时间回复,个人微信就不要再要了,个人时间有限,请见谅。

最后,希望各位小伙伴继续戴口罩,加强锻炼,要玩好技术,要有好身体!