IntelligentArduinoCar

姓名	邓旺
学号	15331061

开题构想

题目

Intelligent Arduino Car based on TensorFlow SSD-Mobilenet model for Android devices

阐述

在Android端运行SSD-Mobilenet model 物体定位追踪模型，使用Android手机提供的高清摄像头进行实时对象识别、定位与追踪，检测目标在当前画面中的位置，并将实时位置信息转化为控制信号传输到与手机连接的Arduino控制模块，该模块收到信号后可以控制小车的方向移动，最终的目的是使小车逐渐向目标物靠近，并且可以随着目标物的移动来修正方向，达到目标去哪儿，小车哪儿的效果。

关键技术

TensorFlow 提供的物体识别模型—SSD-Mobilenet model
Arduino控制模块的搭建与使用
SSD-Mobilenet model模型到Android端的移植

项目计划

整个项目主要分成三个阶段：

第一阶段（11.1~11.15）：购买组装Arduino，学习Arduino相关知识，做到使用Arduino控制小车；这一阶段主要是Arduino的学习，从购买组装Arduino小车到实现用android程序控制小车进行基本的前后左右移动，实现遥控的功能。
第二阶段（11.16~12.15）: tensorflow对象识别模型学习，根据项目需要进行个人定制；这一阶段集中于tensorflow的学习，首先是tensorflow编译环境的搭建，主然后是对象识别模型的学习，根据给出的android demo,在理解其原理的基础上进行适当的改造，以达到项目的需要，预想的效果就是能够识别特定的物体，能够检测物体在屏幕中的相对位置
第三阶段（12.15~1.15）: 整合优化这一阶段需要对前面两个阶段的产物进行一个整合，以达到最终的目的。另外，就是项目优化，如Arduino怎么更灵活地控制小车，tensorflow对象识别模型怎么更精确地识别物体等等，以达到更好的效果

项目进展

第一阶段

时间：2018.11.1 ～ 2018.11.15

根据之前的项目计划，这个阶段的工作主要是Arduino环境的搭建，包括两个内容：

通过手机连接控制Arduino控制模块，实现将手机的信号转化为Arduino可是别的信号
使用Arduino模块控制小车的移动，包括前进、后退以及左右移动

功能实现

对于第二个内容主要是便硬件层面的，在购买的小车的时候，卖家推荐了Anduino UNO R3 开发板和2路电机&16路舵机驱动板的组合方案，卖家提前把控制程序烧到了两个电路板中了。这样2路电机&16路舵机驱动板只需要接收到Anduino UNO R3 开发板传输过来的信号，然后通过连接就可以直接控制小车的移动，这样就不需要太关心硬件层面的东西。

对于第一个功能，之前看给Android手机加双Arduino翅膀给出的方案的时候是使用USB连接手机和Arduino控制模块的，但是购买设备的时候只有Wifi和蓝牙两种连接方式，后来我买了使用wifi连接的设备，所以只有想其他办法。后来使用socket通信的方式进行连接，Anduino UNO R3 开发板加上一个wifi模块，这样就能扩散出一个特定Ip地址的wifi信号，然后手机连接上这个wifi信号就能够将信号传输到Arduino控制模块，实现与手机的互联。

第二阶段

第二阶段计划分成两个部分完成，第一部分主要是tensorflow环境的搭建与demo的编译

第一部分

时间：2018.11.16 ～ 2018.12.1

这一部分的主要是熟悉使用tensorflow进行android开发的流程；

第一步就是尝试编译tensorflow给出的demo中的源码，这里官网提供了两种编译方式，两种方式的目的都是一样的，都是获取对象识别相关模块的依赖。两种方式我都进行了尝试了，第一种使用android studio编译的方式非常简单，通过JCenter的方式添加依赖，需要在Android Studio中安装好ndk、CMake、LLDB这几个东西，然后修改nativeBuildSystem的值为'none'就可以直接编译了。另外一种方式是使用bazel编译tensorflow的源码生成apk，整个过程下来，感觉这一种方式相比第一种方法更复杂，耗时特更久，对于本项目的应用场景，第一种方式也更适用。

在这个过程中有一个很收益的收获，那就是学习新的东西、新的技术最好的途径是直接看官方文档，而不是照的网上各种各样的技术博客来学习，一来博客的质量参差不齐，二是随着技术的更新有些博客已经过时了，这样照的博客来就会遇到很多奇怪的问题。最开始，我是照着博客使用bazel编译tensorflow的方式来添加依赖的，中间就遇到很到很多问题，比如：bazel版本的问题、ndk版本的问题，中间花了很多时间，现在看来很不必要，所以以后学习一个新的东西还是直接参考官方文档，避免走冤枉路。

第二部分

时间：2018.12.1 ～ 2018.12.15

这一部分主要是结合demo理解tensorflow物体识别相关部分的源码。

项目中的重要的文件：

assets：pb文件存放训练好的TensorFlow模型，txt文件为能够识别的物体的名字，也叫label。model和label成对出现。官方给出的inceptionV1模型能够识别1000种物体，基本能够满足我们的日常需求。添加自己的模型时，需要在assets目录中加入自己训练好的model和对应label文件。我们打开项目中的coco_labels_list.txt就可以看到tensorflow已经支持的一些可以识别出的物体。

通过查看相关代码发现，前期很多工作就是捕捉摄像头的预览图像，然后将图像对应的矩阵作为参数传给tensorflow提供的接口进行处理，然后返回数据。获取预览图像不是我们这儿研究的重点，着重看一下对象识别相关的代码。

与物体识别相关部分代码的理解：

构建探测器（分类器）

  classifier =
      TensorFlowImageClassifier.create(
          getAssets(),
          MODEL_FILE,
          LABEL_FILE,
          INPUT_SIZE,
          IMAGE_MEAN,
          IMAGE_STD,
          INPUT_NAME,
          OUTPUT_NAME);

构造分类器，利用了TensorFlow训练出来的 Model，也就是上面我们介绍的assets里面的 .pb 文件，这是后面做物体分类识别的关键。在这个方法内部详细分为一下几个步骤：

构造TensorFlowImageClassifier分类器，inputName和outputName分别为模型输入节点和输出节点的名字

  TensorFlowImageClassifier c = new TensorFlowImageClassifier();
  c.inputName = inputName;
  c.outputName = outputName;

读取label文件内容，将内容设置到出classifier的labels数组中

    // 读取label文件流，label文件表征了可以识别出来的物体分类。我们预测的物体名称就是其中之一。
    br = new BufferedReader(new InputStreamReader(assetManager.open(actualFilename)));
    // 将label存储到TensorFlowImageClassifier的labels数组中
    String line;
    while ((line = br.readLine()) != null) {
      c.labels.add(line);
    }
    br.close();

读取model文件名，并设置到classifier的interface变量中

c.inferenceInterface = new TensorFlowInferenceInterface(assetManager, modelFilename);

利用输出节点名称，获取输出节点的shape，也就是最终分类的数目

  // 输出的shape为二维矩阵[N, NUM_CLASSES], N为batch size，也就是一批训练的图片个数。NUM_CLASSES为分类个数
  final Operation operation = c.inferenceInterface.graphOperation(outputName);
  final int numClasses = (int) operation.output(0).shape().size(1);

设置分类器的其他变量

  c.inputSize = inputSize;    // 物体分类预测时输入图片的尺寸。也就是相机原始图片裁剪后的图片。默认为224*224
  c.imageMean = imageMean;    // 像素点RGB通道的平均值，默认为117。用来将0~255的数值做归一化的
  c.imageStd = imageStd;      // 像素点RGB通道的归一化比例，默认为1

分配Buffer给输出变量

  c.outputNames = new String[] {outputName};    // 输出节点名字
  c.intValues = new int[inputSize * inputSize];
  c.floatValues = new float[inputSize * inputSize * 3];     // RGB三通道
  c.outputs = new float[numClasses];            // 预测完的结果，也就是图片对应到每个分类的概率。我们取概率最大的前三个显示在app中

利用TensorFlow模型来处理图片利用上面构建的分类起对图片进行预测分析，得到图片为每个分类的概率

final List<Classifier.Recognition> results = classifier.recognizeImage(croppedBitmap);

这儿我们重点来看分类器是如何来识别图片的。也就是 classifier.recognizeImage()

public List<Recognition> recognizeImage(final Bitmap bitmap) {
  // 1 预处理输入图片，读取像素点，并将RGB三通道数值归一化. 归一化后分布于 -117 ~ 138
  bitmap.getPixels(intValues, 0, bitmap.getWidth(), 0, 0, bitmap.getWidth(), bitmap.getHeight());
  for (int i = 0; i < intValues.length; ++i) {
    final int val = intValues[i];
    floatValues[i * 3 + 0] = (((val >> 16) & 0xFF) - imageMean) / imageStd;   // 归一化通道R
    floatValues[i * 3 + 1] = (((val >> 8) & 0xFF) - imageMean) / imageStd;    // 归一化通道G
    floatValues[i * 3 + 2] = ((val & 0xFF) - imageMean) / imageStd;           // 归一化通道B
  }
  Trace.endSection();

  // 2 将输入数据填充到TensorFlow中，并feed数据给模型
  // inputName为输入节点
  // floatValues为输入tensor的数据源，
  // dims构成了tensor的shape, [batch_size, height, width, in_channel], 此处为[1, inputSize, inputSize, 3]
  Trace.beginSection("feed");
  inferenceInterface.feed(inputName, floatValues, 1, inputSize, inputSize, 3);
  Trace.endSection();

  // 3 跑TensorFlow预测模型
  // outputNames为输出节点名， 通过session来run tensor
  Trace.beginSection("run");
  inferenceInterface.run(outputNames, logStats);
  Trace.endSection();

  // 4 将tensorflow预测模型输出节点的输出值拷贝出来
  // 找到输出节点outputName的tensor，并复制到outputs中。outputs为分类预测的结果，是一个一维向量，每个值对应labels中一个分类的概率。
  Trace.beginSection("fetch");
  inferenceInterface.fetch(outputName, outputs);
  Trace.endSection();
  
  ...
}

图片识别主要分为以下几步：

预处理输入图片，读取像素点，并将RGB三通道数值归一化. 归一化后分布于 -117 ~ 138
将输入数据填充到 TensorFlow 中，并feed数据给模型
跑 TensorFlow 预测模型
将 tensorflow 预测模型输出节点的输出值拷贝出来

TensorFlow-Android sdk对TensorFlow封装得很好，暴露了TensorFlowInferenceInterface这个对象来作为接口供我们调用底层TensorFlow代码。其中feed用来填充输入图片，run用来跑模型并得到结果，fetch用来从TensorFlow内部获取输出节点的输出值。

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
android		android
anduino		anduino
anduinoCar		anduinoCar
会议总结		会议总结
README.md		README.md
开题报告.pdf		开题报告.pdf
第一次论文阅读+毕设构思(已放弃).pptx		第一次论文阅读+毕设构思(已放弃).pptx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IntelligentArduinoCar

目录

开题构想

题目

阐述

关键技术

相关链接

项目计划

项目进展

第一阶段

功能实现

相关代码

第二阶段

第一部分

第二部分

About

Releases

Packages

Languages

csq20081052/IntelligentArduinoCar

Folders and files

Latest commit

History

Repository files navigation

IntelligentArduinoCar

目录

开题构想

题目

阐述

关键技术

相关链接

项目计划

项目进展

第一阶段

功能实现

相关代码

第二阶段

第一部分

第二部分

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages