邮件01

发件人:Michael

收件人:李光学

主题:卷烟图像识别

内容:

多谢Larry的信息,今早的会议可能还有跟多的问题需要大家帮忙,今天在西雅图,我和述哲讨论了一些核心技术与数据准备工作,建议先从识别开始请大家看一下,开会再讨论

数据需求:先把需求全部列出,可以逐步完成,真伪的识别是一个很严重的问题,数据的采集上,希望是越全面越好。

  1. 每一种烟盒需要以下图片

a. 六面(正,反,上,下,左,右)图片:每个面各有12张,叙述如下

i. 左转10,20,30度

ii. 右转10,20,30度

iii. 上翻10,20,30度

iv. 下翻10,20,30度

b. 用iPhone, 以及国内市场占有率前三名的Android手机拍摄。拍摄前把镜头清干净。

c. 每个拍摄手机由三位不同人员个拍一组。

  1. 每张图片至少附上品牌名称,生产厂商,型号(同一品牌常有不同型号,不同价格)

  2. 在全面展开前我们可以先从2, 3个品牌收集数据做POC。

核心技术

  1. 算法:深度学习, CNN, ResNet(解决CNN层次超过20左右,数据退化,准确度降低的问题)

  2. 计算平台:Horovod(数据并行),TensorFlow,GPUs

整理

Michael与述哲关于项目设计的核心技术和数据准备进行讨论。

数据方面,需要提出的是真伪的问题。

烟盒图像方面采集:

  • 六面(前、后、上、下、左、右),而每个面有12张图片

    • 左转10,20,30度
  • 右转10,20,30度

  • 上翻10,20,30度
  • 下翻10,20,30度

  • 使用iphone,或者国内市场常用手机前三名的Android手机拍摄

  • 每个拍摄手机由3位不同人员各拍一组

  • 每张图片至少包含品牌名称、生产厂商、型号(同一品牌常有不同型号,不同价格)

  • POC先从2~3个品牌收集的数据开始

核心技术:

  • 算法:深度学习,CNN,ResNet(解决CNN层次超过20,数据退化,准确度降低的问题)

  • 计算平台:Horovod(数据并行),Tensorflow,GPUs

results matching ""

    No results matching ""