近期在Google Cloud Next大会上,Google发布了Cloud Machine Learning API更新。其中包括用于计算机视觉、智能视频分析、语音识别、自然语言处理、机器翻译和职位搜索等领域的一系列API,使用户能构建看得见、听得到并能理解非结构化数据的机器学习应用,有助于实现下一代产品推荐、医学影像分析和欺诈检测等用例。
Google Cloud AI及Machine Learning部门首席科学家李飞飞(Fei-Fei Li)撰文介绍了Cloud Machine Learning API等内容,其中包括:
Cloud Datalab
Cloud Video Intelligence
Cloud Vision
Cloud Jobs
Cloud Machine Learning Engine现已达到了通用(GA),企业可以使用它在云端生产环境中训练和部署自己的模型。它是一个托管服务,用于定制基于TensorFlow的机器学习模型。它还集成了Google Cloud Platform的数据分析管道,其中包括数据处理(Cloud Dataflow)、数据科学工作流(Cloud Datalab)和SQL分析(Google BigQuery)等服务。
Google团队也与一些技术合作伙伴协作,将他们的解决方案部署到Cloud Machine Learning Engine,例如SpringML和SparkCognition。前者使用云平台为终端用户提供实时分析,后者使用云平台检测并阻止零日攻击。
Cloud Datalab是一个交互式数据科学工作流工具,目前也已达到了GA。开发人员和数据科学家可使用它对BigQuery、Cloud Storage或本地存储中的数据进行探索、分析和可视化。Cloud Datalab可用于典型机器学习开发生命周期中的各个步骤,即在本地存储的较小规模数据集上构建模型原型,然后在云端使用全部数据集训练模型。这次发布的更新中包括了对TensorFlow和Scikit-learn的支持,并支持直接使用Cloud Dataflow或是通过Cloud Dataproc使用Apache Spark进行批处理和流数据处理。
Cloud Video Intelligence API使用了内置TensorFlow的深度学习模型,应用于YouTube这样的媒体平台。该API允许开发人员通过提供视频中实体的相关信息去搜索和发现视频内容。搜索条件可以是“狗”、“花”、“人”这样的名词,也可以是“跑”、“游”、“飞”这样的动词。它还提供对语境的理解,能给出被检索实体在视频中出现的时刻。
该API当前处于Private Beta开发阶段。媒体公司和消费技术公司可使用该API洞悉视频类非结构化数据。用例包括构建媒体编目,以及发现管理众筹内容的方法。
这次新发布中还包括了Cloud Vision API 1.1版,一种使用机器学习模型(通过REST API)帮助理解影像内容的API。它可将图像分类为多个不同类别,检测影像中的个体及面部信息,发现并阅读影像中包含的打印体单词(OCR)。其用例包括:为图形编目构建元数据、调整图像中的攻击性内容以及使用图像情感分析开发营销场景。例如,在使用了Cloud Vision API的Realtor.com网站上,客户通过使用智能手机抓拍居所的照片,就能立刻获取房产的相关信息。
Cloud Jobs API使用机器学习为求职网站提供职位搜索用例。Commute Search是其中的一个新特性,它能根据用户所需的通勤时间和首选的交通模式,检索并返回适合的职位。该API使用机器学习理解各种职位搜索属性,例如职位头衔、职位描述、所需技能和求职意向等,然后基于分类和关系模型给出匹配求职者意向的职位列表。
与此相关的新闻是Google将Kaggle并入了Google Cloud平台。Kaggle是世界上最大的数据科学家和机器学习爱好者社区,其中提供了对机器学习和数据分析中最新动态的探索、分析和理解。
查看英文原文: Google Announces Cloud Machine Learning API Updates