PaddlePaddle Hackathon¶
这个是百度的一个开源比赛,AI 方向,不在学校承认的竞赛之内。但好处有:
- 可以学到很多东西,比如规范地贡献开源项目
- 对进入百度实习有帮助
- 有钱拿
报名 ¶
注意关注官方 github。一般在春季学期开学的时间。
报名(建议组队,最好能线下)需要在 issue 下认领任务,然后根据赛道发简历给对应的邮箱。简历通过后会可能有笔试,当时做的笔试如下
说明:请根据要求完成以下问题,问题 1 的回答保存成 py 文件,问题 2、3 直接在题目文件中作答,完成后将 2 个文件打包发回即可。考核达到 60 分即为合格,每超时 10 分钟扣除 10% 的分数,在限定的 1 个小时内最多可提交 2 次。
-
请将代码 code.py 中的 torch 组网代码转换成 paddle
。 (60 分) -
请阅读项目 https://github.com/DingXiaoH/RepVGG 的代码
- 找出 RepVGG-A0 模型训练的学习率、batchsize、数据增强配置
。 (30 分) - 如果还有余力,你可以列出尽可能多的训练配置参数,可以获得额外加分
。 (上限 10 分)
- 找出 RepVGG-A0 模型训练的学习率、batchsize、数据增强配置
- 简要回答以下题目,每题 10 分。
- 什么是 AMP,会对训练造成哪些影响?
- 如果在训练过程中发现数据读取速度较慢,可以有哪些方法优化?
- 在复现过程中,如果发现 paddle 与 torch 模型前向结果不一致,应该如何调试?
之后会有导师来加微信,整个交流会在同一个赛道的微信群里。有的导师要求每周汇报,有的老师就放手不管(有问题会来回答)
参赛 ¶
我参加的是 2023 的,虽然学了些东西,但是最后也没有产出有点遗憾。虽然给的时间有两三个月,但还是建议一拿到题目就开始做。算力是使用百度公开的 ai studio,没有其他单独的服务器。这个平台每次登陆都可以领券,如果参加比赛可以找导师要券。