Группа математиков под руководством Тэхо Ким Университета Лихай разработал МАЛП, новый статистический метод, переворачивающий парадигму прогнозирования. Вместо минимизации средней ошибки (как всегда делал метод наименьших квадратов), MALP максимизирует коэффициент корреляции конкордации. Перевод: Неважно, если в среднем вы ошибаетесь совсем немного, важно, чтобы каждое отдельное предсказанное значение было максимально согласовано с реальным..
Исследование, опубликованное на arXiv в сентябре 2025 года, показывает, что MALP даёт прогнозы с превосходной согласованностью в тестах, включающих ОКТ-сканирование глаза и измерение доли жира в организме. Что это значит? Я расскажу вам, точнее, напишу, прямо сейчас.
Согласие и ошибка: различие, которое имеет значение
На протяжении десятилетий предиктивная статистика была сосредоточена на одной цели: уменьшении средней ошибки. Метод наименьших квадратов, краеугольный камень линейной регрессии, работает следующим образом. Он берёт все расхождения между прогнозируемыми и фактическими значениями, возводит их в квадрат, суммирует и пытается минимизировать полученную сумму. Он хорошо работает, когда вы хотите, чтобы ваши прогнозы были «близки» к фактическим значениям в среднем.
Но Ким и его коллеги задавались вопросом: это действительно необходимо? Во многих научных и медицинских контекстах важна не средняя ошибка, асоглашение по пунктамЕсли одно медицинское устройство показывает 200, а другое — 195, даже если средняя погрешность на тысячу измерений приемлема, это единичное расхождение может создать диагностические проблемы.
Коэффициент корреляции конкордации (CCC), введенный Лином в 1989 году, измеряет, насколько хорошо данные согласуются на 45-градусной линии на диаграмме рассеяния. Если предсказанное значение равно фактическому значению статистического прогноза, точка точно попадает на эту линию. MALP предназначен для максимального соответствия этому значению.
Тесты: ОКТ и жировая прослойка
Чтобы продемонстрировать эффективность MALP, команда провела испытания на двух реальных наборах данных. Первый касался сканирование глаз с оптической когерентной томографией (ОКТ). Больницы переходят со старой системы ОКТ Stratus на новую ОКТ Cirrus, и врачам приходится конвертировать измерения для сравнения результатов с течением времени.
Используя высококачественные сканы 26 левых и 30 правых глаз, исследователи проверили, насколько точно MALP может предсказывать показания Stratus на основе данных Cirrus. Результат: Прогнозы MALP, более соответствующие фактическим значениям Stratus, чем прогнозы, полученные с помощью метода наименьших квадратов, хотя у последнего средняя ошибка была немного ниже. Похоже, что метод наименьших квадратов давал «более или менее правильные» ответы, а MALP стремился к «полностью правильным».
Во втором исследовании приняли участие 252 взрослых, которым измеряли вес, окружность талии и другие параметры тела. Точное измерение содержания жира в организме требует дорогостоящих методов, таких как подводное взвешивание, поэтому часто используются косвенные оценки. И здесь MALP предоставил прогнозы, которые в большей степени соответствовали фактическим значениям, чем традиционные методы статистического прогнозирования.
Когда вам нужна конкорданс (и когда не нужна)
Ким ясно дал понять: MALP не является заменой наименьших квадратов в любом контексте. Если цель — минимизировать общую ошибку в больших наборах данных, традиционные методы вполне подходят. Но когда требуется однозначное соответствие между прогнозами и реальностью, MALP становится наиболее подходящим инструментом. Обратите внимание: персонализированная медицина, где каждый пациент важен индивидуально, или к калибровке научных приборов, где точность в каждой точке имеет решающее значение.
Команда уже работает над расширением MALP за пределы линейных предикторов. Цель — разработать Предиктор максимального согласия (MAP), более общая версия, применимая к нелинейным моделям. Ким признаёт, что «наша текущая система ограничена линейными предикторами, достаточно широкими для многих областей, но всё ещё математически узкими».
Последствия этого охватывают экономику, эпидемиологию и инженерию. Всякий раз, когда необходимо перевести измерения между различными системами или обеспечить не только «близость», но и… совпадение в действительности MALP предлагает конкретную альтернативу классическим методам.
Возможно мы не можем на самом деле предсказать будущее: но мы, по крайней мере, можем точнее предсказывать настоящее. И в мире, где каждый процент совпадения может означать более надёжную диагностику или более точно откалиброванные инструменты, это имеет огромное значение.