Машинное обучение в облаке Microsoft Azure.Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении. Накопленные при этом данные позволяют решать задачи прогнозирования, управления и принятия решений, которые часто сводятся к обучению по прецедентам. Раньше, когда таких данных не было, эти задачи либо вообще не ставились, либо решались совершенно другими методами.
Это метод обработки и анализа данных, который позволяет выполнить обучение компьютеров на основе имеющихся данных с целью прогнозирования будущего поведения, результатов и тенденций. Данная облачная служба выступает в роли прогнозной аналитики, которая позволяет быстро создавать и развертывать прогнозные модели в качестве готовых решений.
Распознавание речи
Распознавание речи — процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи.
Основные понятия, которые характеризуют параметры речи человека можно разделить на четыре группы объективных признаков, позволяющих различать речевые образцы: спектрально-временные, кепстральные, амплитудно-частотные и признаки нелинейной динамики.
Успешными примерами использования технологии распознавания речи в мобильных приложениях являются: ввод адреса голосом, голосовой поиск Google Now.
Помимо мобильных устройств, технология распознавания речи находит широкое распространение в различных сферах бизнеса:
- Телефония;
- Решения "Умный дом";
- Десктопы и ноутбуки;
- Автомобили;
- Социальные сервисы для людей с ограниченными возможностями.
Распознавание жестов
Жестовый интерфейс — подмножество системы ввода для графического пользовательского интерфейса для устройств, оснащённых специальными либо устройствами ввода (отличными от клавиатуры), либо сенсорными экранами и позволяющая эмулировать клавиатурные команды (либо сочетания клавиш) при помощи жестов (росчерков). Основной мотивацией разработки таких интерфейсов является улучшение эргономичности управления, с отказом от привычного для компьютерных программ меню приложения.
Подобный интерфейс реализован в сенсорных экранах и панелях.
Сами жесты могут производиться:
- на поверхности стола/любой иной поверхности;
- на экране самого управляемого устройства;
- в пространстве; на поверхности специального устройства.
Распознавание рукописного ввода
Распознавание рукописного ввода — это способность компьютера получать и интерпретировать рукописный ввод. Распознавание текста может производиться «офлайновым» методом из уже написанного на бумаге текста или «онлайновым» методом считыванием движений кончика ручки, к примеру по поверхности специального компьютерного экрана.
Распознавание рукописного ввода широко используется в КПК. Первым КПК, который был способен распознавать рукописный ввод, является Apple Newton.
Распознавание образов
Распознавание образов — это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных данных, которые характеризуются конечным набором некоторых свойств и признаков.
Применяется довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно или нельзя переходить улицу.
Необходимость в таком распознавании возникает в самых разных областях — от военного дела и систем безопасности до оцифровки аналоговых сигналов.
Техническая диагностика
Техническая диагностика — область знаний, охватывающая теорию, методы и средства определения технического состояния объектов
Техническая диагностика является составной частью технического обслуживания. Основной задачей технического диагностирования является обеспечение безопасности, функциональной надёжности и эффективности работы технического объекта, а также сокращение затрат на его техническое обслуживание и уменьшение потерь от простоев в результате отказов и преждевременных выводов в ремонт.
Медицинская диагностика
Медицинская диагностика — процесс установления диагноза, то есть заключения о сущности болезни и состоянии пациента, выраженное в принятой медицинской терминологии. Этим же термином называется и раздел клинической медицины, изучающий содержание, методы и последовательные ступени процесса распознавания болезней или особых физиологических состояний.
В настоящее время в различных областях медицины применяются специфические для данной области методы диагностики. Например, в общей хирургии применяются нижеизложенные методы:
- внешний
- биопсия — исследование под
- лапароскопия;
- исследование с помощью зондов, специальной камеры;
- пальпация;
- рентгенография;
- ультразвуковое исследование и пр.
Биоинформатика
Биоинформатика — совокупность методов и подходов прикладной математики, статистики и информатики.
Используется в биохимии, биофизике, экологии и в других областях.
Наиболее часто используемыми инструментами и технологиями в этой области являются^
- языки программирования Java, C#, Perl, C, C++, Python, R;
- язык разметки XML;
- базы данных;
- программно-аппаратная архитектура параллельных вычислений;
- пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете — MATLAB, и электронные таблицы.
Кредитный скоринг
Кредитный скоринг — система оценки кредитоспособности (кредитных рисков) лица, основанная на численных статистических методах. Скоринг заключается в присвоении баллов по заполнению некой анкеты, разработанной оценщиками кредитных рисков андеррайтерами. По результатам набранных баллов системой принимается решение об одобрении или отказе в выдаче кредита.
Как правило, используется в потребительском (магазинном) экспресс-кредитовании на небольшие суммы. Также возможно его использование в бизнесе сотовых операторов, страховых компаний и т. д.
Возможно построение скоринговой модели по кредитам субъектов хозяйствования, стандартизируя процесс принятия решения.
Прогнозирование ухода клиентов
Отток клиентов – это потеря клиентов, выраженная в отсутствии покупок или платежей в течение определенного периода времени.
Прогноз оттока клиентов крайне важен для компаний с подписной и транзакционной моделью бизнеса, подразумевающих регулярные платежи в сторону компании. Это банки, операторы связи, SaaS-сервисы, магазины.
Хемоинформатика
Хемоинформатика (химическая информатика, молекулярная информатика) — применение методов информатики для решения химических проблем.
Сферы приложения хемоинформатики:
- прогноз физико-химических свойств химических соединений (в частности, липофильности, водорастворимости),
- свойств материалов,
- токсикологическая и биологическая активность,
- ADME/T,
- экотоксикологические свойства,
- разработка новых лекарственных препаратов и материалов.
Обучение ранжированию в информационном поиске
Обучение ранжрованию — это класс задач машинного обучения, заключающихся в автоматическом подборе ранжирующей модели по обучающей выборке, состоящей из множества списков и заданных частичных порядков на элементах внутри каждого списка. Частичный порядок обычно задаётся путём указания оценки для каждого элемента.
Примененимо в информационном поиске к поисковым системам. Каждый список представляет собой набор документов, удовлетворяющих некоторому поисковому запросу.
Обучающая выборка состоит из выборки поисковых запросов, подмножества документов, им отвечающим, и оценок релевантности каждого документа запросу. Они могут быть подготовлены как вручную, специально натренированными людьми (оценщиками качества поиска или асессорами), так и автоматически, на основе анализа пользовательских кликов или таких средств поисковых систем, как система SearchWiki поисковой системы Google.