裘剑东
我专注于 AI推理性能优化 / RISC-V算子优化. 关注CPU端模型部署、RVP/RVV向量化、性能分析与软硬件协同优化.
技术关键词
- AI推理与算子优化: TFLite Micro, vLLM, CPU端模型部署, 算子库维护, 数据布局与向量化优化.
- RISC-V性能优化: RVP/RVV intrinsic, NMSIS, cycle/benchmark性能分析, 嵌入式与Linux RISC-V软件栈适配.
- 工程能力: C/C++, Python, Verilog, Bazel, SDK/基础库维护, 单元测试与跨平台移植.
工作经历
基础软件开发工程师 2024年6月 - 至今
- 维护 Nuclei SDKNuclei NMSIS, 适配新的RISC-V CPU特性, 为基础算子添加RVP/RVV实现并进行性能验证.
- 维护 Nuclei AI Librarynpk-tflm, 熟悉TFLite Micro等AI推理框架在RISC-V CPU上的部署、算子适配与运行时集成流程.
- 维护 Nuclei Audio Library, 结合音频/信号处理场景优化底层计算内核, 关注数据布局、访存开销和指令级并行.
感知算法工程师 2023年10月 - 2024年6月
- 自研超声波障碍物检测算法, 实现障碍物坐标定位与类型判断, 具备从传感器数据处理到车端算法落地的工程经验.
高性能计算工程师 2023年7月 - 2023年10月
- 维护基于Nvidia Video Codec SDK的图像编解码工具, 处理视频数据链路中的性能与稳定性问题.
- 基于Bazel构建DDS通信中间件并编写单元测试, 熟悉基础软件构建、测试与工程化交付流程.
项目经历
RISC-V架构下基于vLLM的大模型推理加速 2025 个人开源项目
- 将 vLLM v0.11.0 移植到RISC-V架构的 openEuler 24.03 (LTS-sp2) 操作系统上, 完成依赖适配、运行环境搭建与推理链路验证.
- 成功加载并运行 Qwen2.5-7B-Instruct 模型, 完成模型推理测试, 项目获得第三届RISC-V基础软件与应用创新大赛优秀奖.
基于国产器件的融合信息处理系统设计及跟踪算法实现 硕士毕业设计
- 完成从单板硬件电路设计到算法实现验证的全链路工作, 具备软硬件协同设计与系统级调试经验.
- 基于多核DSP实现KCF目标跟踪算法, 结合FPGA硬件模块加速特征提取, 熟悉计算密集型算法在异构平台上的实现与优化.
Verilog实现图像超分辨率算法 2022 个人开源项目
- 使用Verilog实现Bicubic插值算法, 将950x540图像上采样至3840x2160分辨率, 实现单周期16像素的并行输出, 体现并行数据通路设计能力.
教育经历
华中科技大学 2020 - 2023
控制科学与工程 硕士
- 主要研究KCF目标跟踪算法的实现与优化, 关注计算密集型视觉算法在国产DSP/FPGA异构平台上的落地, 在 CSDN 博客 中记录了相关研发过程.
华中科技大学 2016 - 2020
集成电路设计与集成系统 本科
- 加权成绩专业第一[成绩单], 辅修计算机科学与技术专业. 熟悉计算机组成原理、数字信号处理与嵌入式系统, 具备硬件背景和扎实数理基础.
获奖经历
开放原子大赛 2024 - 2025
- 第三届 RISC-V 基础软件与应用创新大赛, RISC-V架构下基于vLLM的大模型推理加速, 优秀奖, 2025 [证书]
- Tecorigin 算子开发任务挑战赛, 入围奖, 2024
大学期间获奖 2016 - 2023
- 国家奖学金, 2017-2018学年度 [证书]
- 华中科技大学三好学生, 2016-2017学年度 [证书]
- 湖北省大学生电子设计"TI杯"竞赛特等奖, 2018, [证书]
- 全国大学生电子设计"TI杯"竞赛省一等奖, 2019
- 社会活动积极分子, 知行优秀三等奖学金, 2020-2021学年度