В работе рассматривается один из вариантов задачи классификации данных в постановке слабо-контролируемого обучения (weakly-supervised learning) [1], называемой обучением на множествах примеров (multi-instance learning), групповым (многоэкземплярным) обучением или обучением на мультимножествах. В данной задаче метки определены для множеств объектов, называемых пакетами (bags). Каждый объект из...
Разработана и применена модель полносвязной нейронной сети для краткосрочного прогноза скорости ветра в 3 различных пунктах наблюдения г. Томск по измеренным историческим значениям метеорологический параметров за предыдущие часы.
Порывы ветра, и особенно интенсивные порывы, являются актуальными для общества, но чрезвычайно сложными для прогнозирования. Предложена методика коррекции численных...
Антропогенные факторы являются одними из наиболее частых причин возникновения лесных пожаров. Более того, в присутствии объектов инфраструктуры, производственных предприятий, железных дорог, автодорог регионального и местного назначения риск возникновения пожаров возрастает. Цель исследования – разработка метода прогнозирования возникновения лесных пожаров в окрестности инфраструктуры железной...
С использованием методов разведочного анализа данных (exploratory data analysis, EDA) и машинного обучения исследован спектральный состав микросейсмического фона в периоды до и после землетрясений с целью выявления их предвестников. Получен интересный результат о том, что за 10–12 часов до большинства (около 90%) исследованных землетрясений в Байкальском регионе наблюдется характерное...
Одно из крупных направлений в области информационных технологий в геологии, геофизике и геохимии – разработка и адаптация передовых подходов, решений и технологий для поддержки исследователей в этих областях, чтобы сделать их работу более простой, естественной, продуктивной.
При проведении научных исследований в геологии используются разнотипные данные, такие как карты, числовые данные,...
Рассматриваются две формальные математические постановки одной из часто решаемых задач машинного обучения - задачи выбора подмножества типичных объектов в метрическом пространстве с помощью FRiS-функции [1]. В первом случае речь идет о задаче классификации, когда объекты обучающей выборки разделены на классы, во втором - о задаче таксономии, в которой принадлежность объекта к тому или иному...
При крупномасштабном моделировании Мирового океана часть процессов не могут быть явно описаны численным решением необходимой системы дифференциальных уравнений. В таких случаях прибегают к параметрическому описанию крупномасштабных последствий подобных мезомасштабных процессов. Обычно разработка схем параметризации и оценка их параметров происходят независимо от моделей климата, в которые они,...
УДК 550.831+838
В работе рассматривается проблемы исследования подземных структур, используя методы искуственного интелекта. В рамках проведенного исследования был использован модельный пример, в котором аномальное гравитационное поле создавалось прямоугольной призмой, расположенной под поверхностью. В ходе исследования призма поворачивалась вдоль оси X на определенный угол. Задача состряла в...
Численное моделирование тепловых процессов играет ключевую роль в различных областях науки и техники, способствуя пониманию физических явлений и созданию новых технологий. Применение сеточных методов в таких исследованиях значительно увеличивает вычислительную нагрузку. Вместе с тем развитие методов моделирования с применением машинного обучения позволяет решать подобные задачи в значительно...
За последние 5 лет в РФ построено 25 новых ветропарков с суммарной мощностью выработки 2 ГВт. В ходе эксплуатации ВЭС происходит сбор данных с использованием АСУТП. На практике существует потребность в разработке моделей прогноза выработки электроэнергии на несколько дней вперед в связи с планированием диспетчерского графика. Производство электроэнергии за счет ветра зависит от атмосферных...
Рукописная подпись до сих пор остается наиболее распространенным способом идентификации личности. Идентификация автора и верификация рукописной подписи является одной из наиболее популярных экспертиз в гражданских и арбитражных судебных спорах. Для идентификации и верификации подписи можно обратиться к специалистам в сфере почерковедческой экспертизы, но данная процедура в настоящее время...
Научные исследования в геологии требуют выполнения определённого набора типовых задач, которые являются важной частью процесса исследования, но при этом достаточно рутинны и однообразны. Современные технологии искусственного интеллекта позволяют облегчить рутинную работу не только в обработке, но и создании новых данных на основе входной информации.
Поиск информации является важной составной...
Структуры аргументации в научных текстах, как правило, формально представляемые графами, аккумулируют доказательства отдельных тезисов и позволяют оценить их убедительность. Короткие статьи обычно посвящены доказательству одного главного тезиса, аргументационные графы таких статей отличаются связностью и имеют корень. Трудно решаемой задачей является автоматическое установление связей между...
Исследование посвящено применению биологических методов кластерного анализа к текстовым данным. Численные методы обладают определенной универсальностью и могут быть использованы в иных, не смежных с биологией, научных направлениях [1]. Цель исследования заключалась в использовании различных методов кластеризации для выявления групп в корпусе текстов, а также установлении между ними...
Задача анализа процессов горения является одним из ключевых и перспективных направлений современной науки в области математического моделирования. Эта задача имеет большое значение в условиях стремительных технических и технологических изменений, помогая оптимизировать работу двигателей и повысить их КПД. В рамках нашего исследования мы пробуем различные подходы к моделированию химической...
Персонализированная медицина – это оказание комплексной медицинской помощи, осуществляемой в соответствии с характеристиками конкретного пациента. Существующие медицинские информационные системы зачастую не учитывают индивидуальные особенности пациентов, такие как генетические данные, личная медицинская история, стиль жизни, текущие показатели здоровья и прочие факторы. Это приводит к...
В сейсмологии одним из ключевых этапов обработки данных является определение времен вступлений P и S волн. К настоящему времени наибольшую популярность приобретают подходы, основанные на использовании сверточных нейронных сетей. Существует большое количество работ, посвященных разработке архитектур нейронных сетей для решения задачи определения времен вступлений. Важным этапом при разработке...
В настоящее время методы машинного обучения и нейронных сетей значительно способствуют решению задач в различных областях, включая сегментацию изображений. Однако обучение большинства моделей требует размеченных экспертами данных, что является значительным ограничением при обработке больших объемов данных. В данной работе предлагается подход, объединяющий self-supervised [1] и supervised...
Обработка МРТ изображений является одной из основных задач исследовательской и практической медицины, посещенной работе с графическими данными. С ростом популярности нейросетевых алгоритмов для обработки изображений, появляется всё больше работ посвященных их применению [1]. Но для внедрения необходимо преодолеть сложности, связанные как с использованием оборудования с ограниченными...