【发布时间】:2017-05-24 17:16:08
【问题描述】:
最近,我们计划构建一个用于图像处理的系统,以从图像中提取信息。目前我们正在使用AWS Rekognition 来执行此操作。但是,在某些情况下,我们无法从 AWS 获得准确的信息。因此,我们计划构建自己的自定义。
我们有 4/5 个月的时间来完成这项工作。至少有一个POC 版本。此外,我们计划为此使用Tensorflow。我们都没有机器学习和深度学习的经验,但已经有 5/6 年的使用不同语言的计算机编程经验。
目前,我正在通过Udemy 的课程学习 ML,我解决此问题的方法是...
- 学习机器学习 (ML)
- 学习深度学习 (DL)
- 在 ML 和 DL 之上,也许我已经准备好了解整个事情并能够构建一个图像处理系统。
概括地说,我的理解是,我必须使用Tensorflow 在Python 中编写一个深度学习程序。通过使用该程序,我必须建立一个模型。然后我必须使用一些训练数据来训练该模型。然后,当我的模型达到一定的准确度时,我将使用一些测试数据。
现在,有些地方我有点困惑,这里是我关于这种困惑的问题......
我知道
tensorflow是一个库,但在某些地方,它也被称为系统。那么,它真的只是一个库(一段代码)吗?我在
Tensorflow教程部分 (https://www.tensorflow.org/tutorials/image_recognition) 中获得了一些图像处理 Python 代码。我们已经测试了该代码,它的工作方式与AWSRecognition 服务的工作方式完全相同。所以,我的疑问是……我可以在生产工作中使用这个 Python 代码吗?在使用一些训练数据训练模型后,这些训练数据是否会成为整个系统的一部分,或者机器学习模型会从这些训练数据中提取一些 META 信息并保留自己而不是完整的原始训练数据(在我的情况下是'将是原始图像)。
我可以在我的 Linux 系统上进行所有这些 ML+DL 编程吗?它有 Pentium 4 和 8GB RAM。
另外,想知道...我提到的为我的问题构建解决方案的方法就足够了,或者我还需要做其他事情。
需要一些指导来消除所有这些困惑。
谢谢
【问题讨论】:
-
你想做什么样的图像识别任务?是分类吗?
-
在基本意义上,它就像 AWS Rekognition - aws.amazon.com/rekognition 系统将扫描图像并返回图像中发现的不同内容作为具有置信度分数的响应。但在这方面,我们有一些计划根据我们的业务需求对其进行定制。
-
不,我的问题是,一张图像包含多个对象,还是一张图像仅包含一个对象。假设有一张包含狗和猫的图像,因此您想预测对象的区域以及对象的类型或图像仅包含狗或仅包含猫,并且您想预测其类型(猫或狗)。
-
两者都可以。但是,大多数情况下,它就像一张包含多种内容的图像。
标签: machine-learning tensorflow deep-learning