邮件01
发件人:Michael
收件人:李光学
主题:卷烟图像识别
内容:
多谢Larry的信息,今早的会议可能还有跟多的问题需要大家帮忙,今天在西雅图,我和述哲讨论了一些核心技术与数据准备工作,建议先从识别开始请大家看一下,开会再讨论
数据需求:先把需求全部列出,可以逐步完成,真伪的识别是一个很严重的问题,数据的采集上,希望是越全面越好。
- 每一种烟盒需要以下图片
a. 六面(正,反,上,下,左,右)图片:每个面各有12张,叙述如下
i. 左转10,20,30度
ii. 右转10,20,30度
iii. 上翻10,20,30度
iv. 下翻10,20,30度
b. 用iPhone, 以及国内市场占有率前三名的Android手机拍摄。拍摄前把镜头清干净。
c. 每个拍摄手机由三位不同人员个拍一组。
每张图片至少附上品牌名称,生产厂商,型号(同一品牌常有不同型号,不同价格)
在全面展开前我们可以先从2, 3个品牌收集数据做POC。
核心技术
算法:深度学习, CNN, ResNet(解决CNN层次超过20左右,数据退化,准确度降低的问题)
计算平台:Horovod(数据并行),TensorFlow,GPUs
整理
Michael与述哲关于项目设计的核心技术和数据准备进行讨论。
数据方面,需要提出的是真伪的问题。
烟盒图像方面采集:
六面(前、后、上、下、左、右),而每个面有12张图片
- 左转10,20,30度
右转10,20,30度
- 上翻10,20,30度
下翻10,20,30度
使用iphone,或者国内市场常用手机前三名的Android手机拍摄
每个拍摄手机由3位不同人员各拍一组
每张图片至少包含品牌名称、生产厂商、型号(同一品牌常有不同型号,不同价格)
POC先从2~3个品牌收集的数据开始
核心技术:
算法:深度学习,CNN,ResNet(解决CNN层次超过20,数据退化,准确度降低的问题)
计算平台:Horovod(数据并行),Tensorflow,GPUs