Машинное обучение
Содержание:
- Почему искусственный интеллект важен в медицине?
- Машинное обучение — это…
- Для чего можно использовать машинное обучение
- Правовые аспекты и стандартизация
- Шаг третий: оценка — что определяет успех? Достаточно ли хороша модель машинного обучения с точностью 95 %?
- 2 . Логистическая регрессия
- Ограниченность нейронных сетей
- Личный мониторинг общественного транспорта
- 6 шагов по созданию вашего следующего проекта
- Недостаточное знакомство с исходными данными
- «Клятва Гиппократа» для ИИ
- А как в России
- Что можно сделать?
- История
Почему искусственный интеллект важен в медицине?
Искусственный интеллект в медицине важен, поскольку может оптимизировать траекторию ухода за больными с хроническими заболеваниями. К примеру, предложить прецизионную терапию при сложных заболеваниях и улучшить зачисление испытуемых в клинические испытания.
Среди других причин, по которым искусственный интеллект в
медицине важен, можно назвать следующие:
Доступ к большому количеству данных.
Ожидается, что медицинские данные будут удваиваться каждые 73 дня к 2020 году. ИИ может использоваться в огромном количестве клинических данных, чтобы найти наилучший путь для каждого пациента.
Повышение клинической надежности.
ИИ помогает врачам надежно распознавать медицинские решения путем агрегирования и отображения информации. В 2016 году такая технология сопоставила 20 миллионов записей и диагностировала редкое заболевание лейкемии.
Уменьшение ошибок, связанных с человеческой усталостью.
Человеческая ошибка обходится дорого, а человеческая усталость может привести к ошибкам. Но искусственный интеллект не страдает от усталости, отвлекающих факторов или настроения, в следствии чего может обрабатывать огромные объемы данных с невероятной скоростью и превосходить людей по точности.
Снижение уровня смертности.
Искусственный интеллект может помочь снизить смертность, поскольку отдает приоритет пациентам, нуждающимся в более срочной помощи. К тому же может рекомендовать индивидуальное лечение.
Снижение медицинских расходов.
Frost & Sullivan сообщает, что искусственный интеллект способен улучшить результаты на 30-40 процентов и снизить стоимость лечения на 50 процентов. Однако, разработка новых лекарств и вакцин требует много времени и затрат. Но, искусственный интеллект может быть использован для обработки примерно 30 миллионов лабораторных и информационных отчетов.
Более легкое выявление заболеваний.
Искусственный интеллект точнее выявляет признаки болезни на медицинских снимках, например МРТ, КТ, УЗИ. Следовательно ,пациенты могут быть диагностированы быстрее и могут начать лечение раньше.
Машинное обучение — это…
Вот самое простое определение, которое я нашел:
Машинное обучение — это « класс методов искусственного интеллекта, которые позволяют улучшить результаты работы компьютеров путем обучения на известных данных», — Berkeley.
Теперь давайте разложим все по полочкам, чтобы выстроить основы знаний в области машинного обучения.
…подраздел искусственного интеллекта (ИИ)
ИИ — это наука и технология по разработке мероприятий и методов, позволяющих компьютерам успешно выполнять задачи, которые обычно требуют интеллектуального осмысления человека. Машинное обучение — часть этого процесса: это методы и технологии, с помощью которых можно обучит компьютер выполнять поставленные задачи.
…способ решения практических задач
Методы машинного обучения все еще в развитии. Некоторые уже изучены и используются (рассмотрим дальше), но ожидается, что со временем их количество будет только расти. Идея в том, что совершенно разные методы используются для совершенно разных компьютеров, а различные бизнес-задачи требуют различных методов машинного обучения.
… способ увеличить эффективность компьютеров
Для решения компьютером задач с применением искусственного интеллекта нужны практика и автоматическая поднастройка. Модель машинного обучения нуждается в тренировке с использованием базы данных и в большинстве ситуаций — в подсказке человека.
…технология, основанная на опыте
ИИ нуждается в предоставлении опыта — иными словами, ему необходимы данные. Чем больше в систему ИИ поступает данных, тем точнее компьютер взаимодействует с ними, а также с теми данными, что получает в дальнейшем. Чем выше точность взаимодействия, тем успешнее будет выполнение поставленной задачи, и выше степень прогностической точности.
Простой пример:
- Выбираются входные данные и задаются условия ввода (например, банковские операции с использованием карт).
- Строится алгоритм машинного обучения и настраивается на конкретную задачу (например, выявлять мошеннические транзакции).
- Используемые в ходе обучения данные дополняются желаемой выходной информацией (например, эти транзакции — мошеннические, а эти нет).
Для чего можно использовать машинное обучение
Описательное применение относится к записи и анализу статистических данных для расширения возможностей бизнес-аналитики. Руководители получают описание и максимально информативный анализ результатов и последствий прошлых действий и решений. Этот процесс в настоящее время обычен для большинства крупных компаний по всему миру — например, анализ продаж и рекламных проектов для определения их результатов и рентабельности.
Второе применение машинного обучения — прогнозирование. Сбор данных и их использование для прогнозирования конкретного результата позволяет повысить скорость реакции и быстрее принимать верные решения. Например, прогнозирование оттока клиентов может помочь его предотвратить. Сегодня этот процесс применяется в большинстве крупных компаний.
Третье и наиболее продвинутое применение машинного обучения внедряется уже существующими компаниями и совершенствуется усилиями недавно созданных. Простого прогнозирования результатов или поведения уже недостаточно для эффективного ведения бизнеса. Понимание причин, мотивов и окружающей ситуации — вот необходимое условие для принятия оптимального решения. Этот метод наиболее эффективен, если человек и машина объединяют усилия. Машинное обучение используется для поиска значимых зависимостей и прогнозирования результатов, а специалисты по данным интерпретируют результат, чтобы понять, почему такая связь существует. В результате становится возможным принимать более точные и верные решения.
Кроме того, я бы добавил еще одно применение машинного обучения, отличное от прогнозного: автоматизация процессов. Прочесть об этом можно .
Вот несколько примеров задач, которые решает машинное обучение.
Логистика и производство
- В Rethink Robotics используют машинное обучение для обучения манипуляторов и увеличения скорости производства;
- В JaybridgeRobotics автоматизируют промышленные транспортные средства промышленного класса для более эффективной работы;
- В Nanotronics автоматизируют оптические микроскопы для улучшения результатов осмотра;
- Netflix и Amazon оптимизируют распределение ресурсов в соответствии с потребностями пользователей;
- Другие примеры: прогнозирование потребностей ERP/ERM; прогнозирование сбоев и улучшение техобслуживания, улучшение контроля качества и увеличение мощности производственной линии.
Продажи и маркетинг
- 6sense прогнозирует, какой лид и в какое время наиболее склонен к покупке;
- Salesforce Einstein помогает предвидеть возможности для продаж и автоматизировать задачи;
- Fusemachines автоматизирует планы продаж с помощью AI;
- AirPR предлагает пути повышения эффективности PR;
- Retention Science предлагает кросс-канальное вовлечение;
- Другие примеры: прогнозирование стоимости жизненного цикла клиента, повышение точности сегментации клиентов, выявление клиентских моделей покупок, и оптимизация опыта пользователя в приложениях.
Финансы
- Cerebellum Capital and Sentient используют машинное обучение для улучшения процесса принятия инвестиционных решений;
- Dataminr может помочь с текущими финансовыми решениями, заранее оповещая о социальных тенденциях и последних новостях;
- Другие примеры: выявление случаев мошенничества и прогнозирование цен на акции.
Здравоохранение
- Atomwise использует прогнозные модели для уменьшения времени производства лекарств;
- Deep6 Analytics определяет подходящих пациентов для клинических испытаний;
- Другие примеры: более точная диагностика заболеваний, улучшение персонализированного ухода и оценка рисков для здоровья.
Больше примеров использования машинного обучения, искусственного интеллекта и других связанных с ними ресурсов вы найдете в списке, созданном Sam DeBrule.
Читать еще: «10 типов структур данных, которые нужно знать»
Правовые аспекты и стандартизация
Специфика российского здравоохранения, как и ряда других стран, состоит в том, что оно по большей части государственное. Коммерческими клиниками представлена лишь небольшая часть рынка. Этот факт должен учитываться компаниями, так как государственная система здравоохранения подразумевает финансирование по системе тендеров и/или грантов.
Для использования технологии в реальной клинической практике требуется регистрационное удостоверение медицинского изделия. Задача усложняется тем, что в законодательстве (по крайней мере, российском) до сих пор не существует определенных стандартов, регламентирующих работу медицинских ИИ-сервисов. Это касается и подготовки датасетов, и проведения клинических и технических испытаний сервисов, и стандарта по интеграции этих сервисов в бизнес-процессы медицинских учреждений.
Но ситуация меняется в лучшую сторону, и этому способствует государство. Правительство запустило Национальную программу «Цифровая экономика», одним из приоритетных направлений которой является цифровизация здравоохранения. Проводится масштабный эксперимент Департамента здравоохранения города Москвы по использованию ИИ-сервисов в работе отделений лучевой диагностики. Результаты проекта станут основой для национальных стандартов, регламентирующих применение ИИ в клинической медицине.
Несмотря на наличие большого количества новых и специфических проблем, при правильном подходе ИИ-сервисы уже сейчас могут позитивно влиять на нашу жизнь и здоровье. При условии тесного взаимодействия разработчиков и медицинского сообщества мы уже в ближайшее время услышим о настоящих историях успеха.
Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.
Шаг третий: оценка — что определяет успех? Достаточно ли хороша модель машинного обучения с точностью 95 %?
Допустим, вы определили задачу своего бизнеса в терминах машинного обучения и у вас есть данные. Теперь нужно выяснить, что определяет успех.
Существуют различные метрики оценки для задач классификации, регрессии и рекомендаций. Какую из них вы выберете, будет зависеть от вашей цели.
Перефразируем.
«Чтобы этот проект был успешным, модель должна быть точной более чем на 95 % в том, что кто-то виноват в аварии или нет.»
Модель с точностью 95 % может показаться довольно хорошей для предсказания виноватого в страховом иске. Но для прогнозирования сердечно-сосудистых заболеваний вы, вероятно, захотите более точных результатов.
Есть и другие вещи, которые нужно принять во внимание при классификации задач
- Ложное отрицательное срабатывание — модель прогнозирует отрицательный вариант, а на самом деле он положительный. В некоторых случаях, таких как прогнозирование спама в электронной почте, ложные срабатывания не так уж и страшны. Но будет гораздо хуже, если система компьютерного зрения для автомобилей с автопилотом не распознает пешехода, когда на самом деле он есть.
- Ложное положительное срабатывание — модель предсказывает положительный вариант, а на самом он отрицательный. Если человеку предскажут болезнь сердца, от которой он на самом деле не страдает, может показаться не таким уж страшным. Лучше перестраховаться, верно? Нет, если это отрицательно влияет на образ жизни человека или устанавливает для него план лечения, в котором он не нуждается.
- Истинное отрицательное срабатывание — модель прогнозирует отрицательный вариант, который на самом деле таковым и является. Это хорошо.
- Истинное положительное срабатывание — модель предсказывает положительный вариант, который на самом деле таковым и является. Это тоже хорошо.
- Точность — какая доля положительных прогнозов была правильной? Модель, которая не даёт ложных срабатываний, имеет точность 1.0.
- Полнота — какая доля фактических положительных вариантов была предсказана правильно? Модель, которая не даёт ложных отрицательных вариантов, имеет отзыв 1.0.
- Оценка F1 — сочетание точности и полноты. Чем ближе к 1.0, тем лучше.
- Кривая рабочих характеристик приёмника (ROC) и площадь под этой кривой (AUC) — кривая ROC представляет собой график, сравнивающий соотношение истинных положительных и ложных положительных вариантов. Метрика AUC — это площадь под кривой ROC. Модель, чьи прогнозы на 100 % неверны, имеет AUC 0.0, а модель, чьи прогнозы являются 100 % правильными, имеет AUC 1.0.
Для задач регрессии (где необходимо предсказать число), допустим, если вы хотите минимизировать разницу между тем, что предсказывает ваша модель, и тем, что является фактическим значением. Если вы пытаетесь предсказать цену, по которой дом будет продаваться, вы захотите, чтобы ваша модель максимально приблизилась к фактической цене. Для этого используйте MAE или RMSE.
Средняя абсолютная ошибка (MAE) — средняя разница между предсказаниями вашей модели и фактическими числами.
Среднеквадратичная ошибка (RMSE) — квадратный корень из среднего квадратов разностей между предсказаниями вашей модели и фактическими числами.
Проблемы с рекомендациями сложнее проверить экспериментально. Один из способов сделать это — взять часть ваших данных и спрятать их. Когда ваша модель построена, используйте её, чтобы предсказать рекомендации для скрытых данных и посмотреть, как они выстраиваются.
Однако традиционные метрики классификации не лучший вариант для задач с рекомендациями. Точность и полнота не имеют понятия порядка.
Если ваша модель машинного обучения вернула список из 10 рекомендаций, которые будут показаны клиенту на вашем веб-сайте, вы бы хотели, чтобы лучшие из них отображались первыми, верно?
— то же, что и обычная точность, однако вы выбираете отсечение k вариантов. Например, точность 5 означает, что вам важны только 5 лучших рекомендаций. У вас может быть 10 000 продуктов, но вы не можете рекомендовать их всем своим клиентам.
Для начала у вас может не быть точной цифры для каждого из них
Но зная, на какие метрики вы должны обращать внимание, вы получите представление о том, как оценить ваш проект машинного обучения
2 . Логистическая регрессия
Логистическая регрессия — ещё один алгоритм, пришедший в машинное обучение прямиком из статистики. Её хорошо использовать для задач бинарной классификации (это задачи, в которых на выходе мы получаем один из двух классов).
Логистическая регрессия похожа на линейную тем, что в ней тоже требуется найти значения коэффициентов для входных переменных. Разница заключается в том, что выходное значение преобразуется с помощью нелинейной или логистической функции.
Логистическая функция выглядит как большая буква S и преобразовывает любое значение в число в пределах от 0 до 1. Это весьма полезно, так как мы можем применить правило к выходу логистической функции для привязки к 0 и 1 (например, если результат функции меньше 0.5, то на выходе получаем 1) и предсказания класса.
Благодаря тому, как обучается модель, предсказания логистической регрессии можно использовать для отображения вероятности принадлежности образца к классу 0 или 1. Это полезно в тех случаях, когда нужно иметь больше обоснований для прогнозирования.
Как и в случае с линейной регрессией, логистическая регрессия выполняет свою задачу лучше, если убрать лишние и похожие переменные. Модель логистической регрессии быстро обучается и хорошо подходит для задач бинарной классификации.
Ограниченность нейронных сетей
Впрочем, в нейронных сетях нет ничего магического и в большинстве случаев опасения касательно сценария «Терминатора» не имеют под собой оснований. Допустим, учёные натренировали нейронную сеть на распознавание рукописных цифр (такое приложение может использовать, скажем, на почте). Как может работать такое приложение и почему здесь не о чем беспокоиться?
Допустим, мы работаем с изображениями 20×20 пикселей, где каждый пиксель представляется оттенком серого (всего 256 возможных значений). В качестве ответа у нас имеется одна из цифр: от 0 до 9. Структура нейронной сети будет следующая: в первом слое будет 400 нейронов, где значение каждого нейрона будет равно интенсивности соответствующего пикселя. В последнем слое будет 10 нейронов, где в каждом нейроне будет вероятность того, что на изначальном изображении нарисована соответствующая цифра. Между ними будет некоторое число слоев (такие слоя называются скрытыми) с одинаковым количеством нейронов, где каждый нейрон соединён с нейроном из предыдущего слоя и ни с какими более.
Рёбрам нейронной сети (на картинке они показаны как стрелочки) будут соответствовать некоторые числа. Причем значение в нейроне будет считаться как следующая сумма: значение нейрона из предыдущего слоя * значение ребра, соединяющего нейроны. Затем от данной суммы берётся определенная функция (например, сигмоидная функция, о которой мы говорили ранее).
В конечном итоге задача тренировки нейронной сети заключается в том, чтобы подобрать такие значения в ребрах, чтобы отдавая первому слою нейронной сети интенсивности пикселей, на последнем слое мы получали вероятности того, что на изображении нарисована какая-то цифра.
Более простыми словами, в данном случае нейронная сеть представляет собой вычисление математической функции, где аргументы — это другие математические функции, которые зависят от других математических функций и так далее. Разумеется, при подобном вычислении математических функций, где подгоняются некоторые аргументы, ни о каком экзистенциальном риске речи идти не может.
Личный мониторинг общественного транспорта
Совсем скоро горожане забудут о долгом ожидании автобусов на остановках — теперь отслеживать прибытие нужного транспорта можно на экране собственного смартфона. Уже сейчас для жителей Москвы, Санкт-Петербурга и Казани Google.Maps в режиме реального времени отображают задержки автобусов, поездов и метро, а также прогноз их загруженности, включая число доступных сидячих мест. Алгоритмы машинного обучения строят прогнозы на основе отчетов о предыдущих поездках .
Аналогичная функция отслеживания транспорта в режиме онлайн доступна в приложении «2ГИС» для жителей Москвы, Санкт-Петербурга, Новосибирска, Казани, Ярославля, Красноярска, Нижнем Новгорода и Челябинска. При нажатии на значок остановки отображается список рейсов и нахождение нужного транспорта на маршруте. Если автобус задержался в пробке или сошел с маршрута, это будет показано на карте всего через 30 секунд .
6 шагов по созданию вашего следующего проекта
Конвейер машинного обучения можно разбить на три основных этапа: сбор данных, моделирование и развёртывание. Все они влияют друг на друга.
Вы можете начать проект со сбора данных, затем смоделировать их, понять, что собранных данных недостаточно, и вернуться к сбору, смоделировать данные снова, найти хорошую модель, развернуть её, обнаружить, что она не работает, создать другую модель, развернуть и её, обнаружить, что она тоже не работает, и вернуться к сбору данных. Это целый цикл.
Что значит модель? Что такое развёртывание? Как собирать данные?
Способ сбора данных будет зависеть от вашей задачи. Например, можно собирать в таблицу списки покупок ваших клиентов.
Под моделированием понимается использование алгоритма машинного обучения для поиска информации в собранных вами данных.
В чём разница между обычным алгоритмом и алгоритмом машинного обучения?
Как и рецепт приготовления вашего любимого блюда, обычный алгоритм — это набор инструкций о том, как превратить набор ингредиентов в шедевр.
Отличительная особенность алгоритма машинного обучения заключается в том, что вместо набора инструкций вы начинаете с ингредиентов и готового блюда. Затем алгоритм рассматривает ингредиенты и финальное блюдо и разрабатывает набор инструкций.
Есть много различных типов таких алгоритмов, некоторые из них работают лучше других, но у всех них одна цель — найти шаблоны или наборы инструкций в данных.
Когда вы будете применять эти шаги для своего проекта, они могут немного меняться в зависимости от специфики, но принципы будут схожими.
Эта статья посвящена моделированию данных. Предполагается, что вы уже собрали данные и хотите с их помощью получить прототип проекта с машинным обучением. Разберёмся, как вы можете подойти к этому.
- Определение задачи — какую бизнес-проблему вы пытаетесь решить? Как это можно сформулировать в виде задачи машинного обучения?
- Данные — какие данные у вас есть? Как это соответствует определению задачи? Данные структурированы или нет? Данные статические или потоковые?
- Оценка — что определяет успех? Достаточно ли хороша модель машинного обучения с точностью 95 %?
- Особенности — какие части данных будут использованы для модели? Как может то, что уже известно, повлиять на это?
- Моделирование — какую модель выбрать? Как вы можете улучшить модель? Как вы сравниваете это с другими моделями?
- Эксперименты — что ещё можно попробовать? Развёрнутая модель работает так, как ожидалось? Как другие шаги меняются в зависимости от того, что вы обнаружили?
Рассмотрим немного подробнее каждый пункт.
Недостаточное знакомство с исходными данными
Плохое понимание исходных данных также является серьёзной проблемой, но эта проблема существовала и во время работы с традиционными статистическими методами. Ошибки в сборе данных — такие как ошибки квантования, неточности считывания и использование замещающих переменных — самые распространённые затруднения.
Субоптимальные данные всегда будут проблемой, но понимать, какой алгоритм применить к какому типу данных — невероятно важно, это значительно повлияет на результат. Это можно продемонстрировать на примере простой регрессии
При использовании линейной регрессии с бОльшим количеством параметров, чем точек данных (очень частая ситуация в геномике, поскольку имеется очень большое количество генов и довольно мало точек данных), выбор оптимизации параметров серьёзно повлияет на то, какие параметры будут определены в качестве «важных».
При использовании регрессии это приведёт к приближению переменных, определённых в качестве незначительных, к нулю. Тем самым будет проведён отбор переменных с исключением избыточных.
Гребневая регрессия сжимает названные параметры до пренебрегаемо малых величин, но не исключает их из набора.
При использовании эластичной сети (комбинации LASSO и гребневой регрессии), мы снова получим совсем другие результаты.
Если мы не будем использовать регрессию, алгоритм очевидно будет страдать от переобучения, поскольку у нас будет больше переменных, чем точек данных, и алгоритм просто заполнит все точки данных.
Конечно, для линейной регрессии можно выполнить статистические тесты, которые помогут установить точность в виде доверительных интервалов, p-тесты и тому подобное. Однако такая роскошь не доступна для нейронных сетей, поэтому можем ли мы быть уверены в выводах? Лучшее, что мы можем сделать — точно определить архитектуру и гиперпараметры модели и предоставить открытый исходный код, чтобы другие исследователи могли проанализировать модель и использовать её самостоятельно.
«Клятва Гиппократа» для ИИ
В эпоху стремительного развития искусственного интеллекта необходимо помнить, что эта технология — это всего лишь инструмент, призванный помочь людям выполнять сложные рутинные задачи, чтобы они могли сконцентрироваться на других аспектах, требующих большего творческого и интеллектуального вовлечения.
Так, ИИ в медицине не может считаться самостоятельной диагностической системой. Технология призвана помочь специалисту поставить более точный диагноз, сформировать индивидуальный план лечения, подобрать наиболее эффективные и безопасные препараты и т.д., тем самым оставляя за врачом право принимать важнейшие решения.
При этом надо помнить, что это право неразрывно связано с ответственностью — врачи, начиная трудовую деятельность, приносят клятву Гиппократа, обязуясь руководствоваться определенными моральными и этическими принципами в своей деятельности.
Сегодня на разработчиков ИИ возлагается не меньшая ответственность. При всех достоинствах и достижениях ИИ в медицине, транспорте, производстве и других сферах мы не можем игнорировать потенциальные риски, связанные с его использованием. Поэтому, чтобы достичь лучшего результата завтра, мы должны уже сегодня создать аналог «клятвы Гиппократа» в сфере ИИ, договорившись о базовых этических принципах развития и использования этой технологии.
А как в России
В России ведётся работа сразу по нескольким направлениям из сферы медицинского искусственного интеллекта. Популярны распознаватели речи и сервисы онлайн-диагностирования болезней по снимкам.
В 2017 году запущен проект Voice2Med, призванный сократить время на заполнение бумаг. Он успешно протестирован в республиканской больнице Татарстана в городе Казань.
Российский Институт развития интернета создает ИИ, который позволит ставить диагнозы самостоятельно, основываясь на снимках МРТ и рентгена.
Ещё одно применение ИИ получило название TeleMD (сервис удалённых консультационных эфиров), которая специализируется на онкологических болезнях.
DOC+ представляет собой «мобильную» клинику, которая вызывает врача домой, бронирует лекарства в онлайн-аптеках, интегрируется с клиниками. При этом приложение сохраняет информацию в электронную медицинскую карту, расположенную в телефоне пациента.
Что можно сделать?
Конечно, не всё так трагично. Та же проблема всегда присутствовала при использовании традиционных статистических методов анализа. Она лишь усугубилась с появлением больших наборов данных и алгоритмов, которые находят корреляции автоматически и не настолько прозрачны, как стандартные методы. И это усиление выявило недостатки научного процесса, которые ещё предстоит преодолеть.
В то же время при разработке систем машинного обучения нового поколения предстоит проделать серьёзную работу, чтобы можно было точно определить достоверность и воспроизводимость результатов анализа.
Как говорится, плох тот рабочий, что винит в неудаче инструмент, и учёным следует уделять больше внимания применяемым алгоритмам МО, чтобы удостовериться в обоснованности выводов их исследований. Институт рецензирования предназначен для отсеивания необоснованных научных работ, но это также и задача каждого отдельно взятого исследователя. Учёные должны знать принципы работы применяемых ими методов, чтобы понимать ограничения этих инструментов. Если их познаний в этой области недостаточно — возможно, стоит заглянуть на кафедру статистики.
Рахими (тот учёный, что считает МО разновидностью алхимии) предлагает несколько подходов, которые позволят определить, как и когда лучше всего применять определённый алгоритм. Он утверждает, что при выборе алгоритма следует проводить исследования абляции — последовательно удаляя параметры, чтобы определить их влияние на выбранную модель МО. Он также предлагает делать анализ срезов — изучая производительность алгоритма, чтобы определить, как улучшения в определённых областях могут отразиться на чём-то ещё. Наконец, он предлагает прогонять алгоритм на разных наборах гиперпараметров, анализируя производительность системы для каждого из них. Таким образом можно повысить уверенность в результатах прогнозов, полученных с помощью МО.
Из-за природы научного процесса, если вышеописанные проблемы будут решены, ложные взаимоотношения, выведенные в результате исследований с применением машинного обучения будут выявлены и дискредитированы. Истинные же корреляции пройдут проверку временем.
История
Развитие искусственного интеллекта, как научного направления, стало возможным только после создания ЭВМ. Это произошло в 40-х годах XX века. В это же время Н. Винер создал свои основополагающие работы по кибернетике.
В 1954 году В МГУ под руководством профессора А. А. Ляпунова начал свою работу семинар «Автоматы и мышление». В этом семинаре принимали участие крупнейшие физиологи, лингвисты, психологи, математики. Считается, что именно в это время родился искусственный интеллект в России.
Исследования, проведенные в 1960-х и 1970-х годах, позволили создать первую экспертную систему, которая известна как DENDRAL. В то время, как она была разработана для применения в органической химии, она послужила основой для последующей системы MYCIN, которая считается одним из наиболее значимых ранних применений искусственного интеллекта в медицине. Однако, MYCIN и другие системы, такие как Internist-1 и CASNET не достигли широкого применения.
1980-е и 1990-е годы привели к распространению микрокомпьютеров и созданию глобальных сетей. Произошло признание исследователями и разработчиками того факта, что системы ИИ в здравоохранении должны быть разработаны. Ученые утверждали, что программы должны быть рассчитаны на отсутствие идеальных сведений и должны опираться на опыт врачей. Новые подходы, связанные с теорией нечётких множеств, сетей Байеса и искусственных нейронных сетей, были созданы, чтобы отражать развитие потребности здравоохранения в интеллектуальных вычислительных системах.
Однако с 2002 года технологии сделали большой шаг вперед, а к программам внедрения искусственного интеллекта в медицину подключились и IT-гиганты, и целые государства. Сегодня ученые надеются, что с помощью искусственного интеллекта уже в ближайшем будущем возможно будет прийти к сверхточной (или прецизионной) медицине, в рамках которой появится возможность назначать индивидуальное лечение каждому отдельному человеку, учитывая его уникальные генетические и другие особенности. В США уже объявили о запуске пилотных проектов по развитию прецизионной медицины.
Медико-технологические достижения, произошедшие в этот полувековой период, позволили вывести здравоохранение на новый уровень. Новые приложения и системы, связанные с ИИ, обладают рядом неоспоримых преимуществ:
- Увеличенная вычислительная мощность приводит к более быстрому сбору и обработке данных.
- Увеличение объема и доступности связанных со здоровьем данных, которые получены из личных и медицинских устройств врачей и пациентов.
- Рост геномных баз данных секвенирования.
- Широкое внедрение электронных медицинских систем записи данных.
К 2019 году для специального исследования будут отобраны 1 миллион добровольцев. Исследование направлено на то, чтобы показать связь между состоянием здоровья, образом жизни, окружающей средой, а также социальным и экономическим статусом. Полученные данные будут обработаны с помощью ИИ.