Грант №20-37-90059

Код конкурса: РФФИ Аспиранты | Ссылка на конкурсы

Объявление конкурса

Условия конкурса (утверждены решением бюро совета РФФИ, протокол № 4 (231) от 27 марта 2020 года, изменения утверждены решением бюро совета РФФИ, протокол № 7 (234) от 19 мая 2020 года) 

1. Общая информация

Задача конкурса – создание молодым ученым - аспирантам условий для подготовки диссертаций на соискание ученой степени кандидата наук, содействие в трудоустройстве и закрепление молодых ученых в российских научных организациях

По вопросам, связанным с подачей заявок в РФФИ, можно обращаться в Службу поддержки пользователей КИАС.

Конкурсная комиссия: бюро совета РФФИ.

Форма проведения конкурса: путем подачи заявок в электронном виде в Комплексной информационно-аналитической системе РФФИ (КИАС РФФИ).

Грантополучатель: юридическое лицо

Срок реализации проекта: 2 года.

Размер гранта на весь срок реализации проекта: 1 200 000 рублей.

2. Требования к участнику конкурса

2.1. Участниками конкурса могут быть юридические лица - научные и образовательные организации высшего образования вне зависимости от их ведомственной принадлежности (кроме казенных учреждений), реализующие программу подготовки научно-педагогических кадров в аспирантуре (далее – Организация).

2.2. Подача заявки на конкурс означает, что:

2.2.1. Организация ознакомлена и согласна с Условиями конкурса;

2.2.2. Организация дает согласие на осуществление в отношении нее проверки РФФИ и уполномоченными органами государственного финансового контроля соблюдения целей, условий и порядка предоставления гранта;

2.2.3. содержание проекта не содержит сведений, составляющих государственную или коммерческую тайну;

2.2.4. содержание проекта не совпадает с содержанием проектов, выполнявшихся ранее за счет Организации.

2.3. Организация должна заключить с РФФИ Соглашение об использовании электронной подписи в электронном взаимодействии РФФИ с юридическим лицом в соответствии с Правилами использования электронной подписи в электронном взаимодействии федерального государственного бюджетного учреждения «Российский фонд фундаментальных исследований» с физическими и юридическими лицами (далее - Правила).

3. Требования к молодому ученому - аспиранту и научному руководителю аспиранта.

3.1. Молодой ученый (далее – аспирант) должен удовлетворять следующим требованиям:

3.1.1. являться аспирантом очной аспирантуры, обучающимся в Организации по основным профессиональным образовательным программам – программам подготовки научно-педагогических кадров в аспирантуре:

- первого года обучения - для аспирантов, зачисленных в трехгодичную аспирантуру;

- второго года обучения - для аспирантов, зачисленных в четырехгодичную аспирантуру;

при этом дата зачисления в аспирантуру - не ранее 01 июня соответствующего года (года зачисления).

3.1.2. иметь не менее одной публикации в издании, включенном в одну из систем цитирования (библиографических баз) Web of Science, Scopus или в перечень ВАК;

3.1.3. иметь оформленное Согласие на признание электронных документов, подписанных в КИАС РФФИ простой электронной подписью, равнозначными документам, составленным на бумажных носителях или Соглашение об использовании электронной подписи в электронном взаимодействии, заключаемое РФФИ с физическим лицом.

3.1.4. проходить обучение в аспирантуре впервые.

3.1.5. аспирант вправе участвовать только в одном проекте, представленном на конкурс.

3.2. Принимая в КИАС РФФИ предложение принять участие в реализации проекта, аспирант подтверждает, что:

3.2.1. ознакомлен с Условиями конкурса и согласен с ними;

3.2.2. содержание проекта не совпадает с содержанием его проектов, выполняемых (выполнявшихся) им за счет РФФИ, РГНФ И РНФ, не содержит сведений, составляющих государственную или коммерческую тайну;

3.2.3. согласен на хранение и обработку его персональных данных РФФИ, их использование для целей проведения экспертизы, информационного и финансового сопровождения проекта;

3.2.4. в случае предоставления гранта согласен на опубликование РФФИ аннотаций проекта и отчетов о реализации проекта, включая сведения о результатах интеллектуальной деятельности, перечня и аннотаций публикаций, приведенных в представленных в РФФИ отчетах.

3.3. Научный руководитель аспиранта должен удовлетворять следующим требованиям:

3.3.1. иметь ученую степень кандидат наук, доктора наук или PhD;

3.3.2. являться научным руководителем аспиранта;

3.3.3. состоять в трудовых отношениях с Организацией;

3.3.4. иметь не менее 5 публикаций за последние 5 лет в журналах, включенных в одну из систем цитирования (библиографических баз) Web of Science, Scopus, РИНЦ, или монографии.

3.3.5. иметь оформленное Согласие на признание электронных документов, подписанных в КИАС РФФИ простой электронной подписью, равнозначными документам, составленным на бумажных носителях или Соглашение об использовании электронной подписи в электронном взаимодействии, заключаемое РФФИ с физическим лицом.

3.4. Создавая (формируя) заявку от имени Организации в КИАС РФФИ научный руководитель аспиранта подтверждает, что:

3.4.1. ознакомлен с Условиями конкурса и согласен с ними;

3.4.2. содержание проекта не совпадает с содержанием его проектов, выполняемых (выполнявшихся) им за счет РФФИ, РГНФ или РНФ, не содержит сведений, составляющих государственную или коммерческую тайну;

3.4.3. согласен на хранение и обработку его персональных данных РФФИ, их использование для целей проведения экспертизы, информационного и финансового сопровождения проекта;

3.4.4. в случае предоставления гранта согласен на опубликование РФФИ аннотаций проекта и отчетов о реализации проекта, включая сведения о результатах интеллектуальной деятельности, перечня и аннотаций публикаций, приведенных в представленных в РФФИ отчетах.

3.5. Научный руководитель аспиранта может являться руководителем Организации (лицом, уполномоченным осуществлять юридически значимые действия от имени Организации с использованием электронной подписи).

4. Требования к проекту

4.1. На конкурс могут быть представлены проекты фундаментальных научных исследований по следующим научным направлениям:

(01) математика, механика;

(02) физика и астрономия;

(03) химия и науки о материалах;

(04) биология;

(05) науки о Земле;

(07) инфокоммуникационные технологии и вычислительные системы;

(08) фундаментальные основы инженерных наук;

(09) история, археология, этнология и антропология;

(10) экономика;

(11) философия, политология, социология, правоведение, история науки и техники, науковедение;

(12) филология и искусствоведение;

(13) психология, фундаментальные проблемы образования, социальные проблемы здоровья и экологии человека;

(14) глобальные проблемы и международные отношения;

(15) фундаментальные основы медицинских наук;

(16) фундаментальные основы сельскохозяйственных наук.

4.2. Срок реализации проекта - 2 года.

4.3. Дата начала реализации проекта:

- дата зачисления в аспирантуру+1 год - для аспирантов, зачисленных в трехгодичную аспирантуру;

- дата зачисления в аспирантуру+2 года - для аспирантов, зачисленных в четырехгодичную аспирантуру.

4.4. Заявленное в проекте исследование должно быть фундаментальным.

4.5. До подведения итогов настоящего конкурса проект не может быть подан на другой конкурс РФФИ.

4.6. Проект не может быть представлен на конкурс, если по своему содержанию он аналогичен проекту, ранее получившему финансовую поддержку РФФИ, РГНФ или РНФ.

5. Порядок подачи заявки Организацией для участия в конкурсе

5.1. Заявка для участия в конкурсе оформляется научным руководителем аспиранта, путем заполнения электронных форм в КИАС РФФИ в соответствии с Инструкцией по оформлению заявки в КИАС РФФИ. Инструкция по оформлению заявки в КИАС РФФИ является неотъемлемой частью Условий конкурса.

Дата и время начала подачи заявок: 20.05.2020 15:00 (МСК)

Дата и время окончания подачи заявок: 22.06.2020 23:59 (МСК)

5.2. В КИАС РФФИ вносятся все сведения, которые необходимы для заполнения форм заявки.

5.3. В разделе «Публикации» должны быть заполнены формы на основные публикации научного руководителя аспиранта (5 публикаций) и аспиранта (1 публикация). К каждой форме должен быть прикреплен файл в формате PDF, содержащий копию публикации. Размер каждого файла не должен превышать 4 Мб.

5.4. Заявка подается в РФФИ (отправляется) руководителем Организации (лицом, уполномоченным осуществлять юридически значимые действия от имени Организации с использованием электронной подписи) в соответствии с Инструкцией по оформлению заявки в КИАС РФФИ.

6. Правила предоставления гранта

6.1. Конкурсный отбор осуществляется на основании экспертизы проектов, проводимой РФФИ.

6.2. Экспертиза проектов осуществляется с учетом следующих критериев:

6.2.1. актуальность исследования;

6.2.2. новизна ожидаемых результатов исследования;

6.2.3. реализуемость проекта;

6.2.4. научный и педагогический задел научного руководителя аспиранта;

6.2.5. научный задел и научные достижения аспиранта.

6.3. Содержание заявки и результаты экспертизы являются конфиденциальными и не подлежат разглашению участникам конкурса и третьим лицам. Организация, научный руководитель аспиранта и аспирант получают в КИАС РФФИ доступ к части экспертного заключения (рецензии) после подведения итогов конкурса.

6.4. РФФИ не вступает в обсуждение результатов экспертизы.

6.5. РФФИ уведомляет участников конкурса о решении конкурсной комиссии в электронном виде в КИАС РФФИ и публикует список победителей конкурса на сайте РФФИ в срок до 15 августа 2020 года.

6.6. Победителям конкурса предоставляется право заключить с РФФИ Договор о предоставлении гранта победителю конкурса и реализации научного проекта (далее – Договор). Бюджет проекта является неотъемлемой частью Договора.

6.7. Оформление и подписание Договора осуществляется только в электронном виде в КИАС РФФИ в соответствии с Инструкцией по оформлению Договора о предоставлении гранта победителю конкурса и реализации научного проекта (далее – Инструкция), являющейся неотъемлемой частью Условий конкурса.

6.8. Оформленный и подписанный в соответствии с Инструкцией Договор должен быть представлен в РФФИ не позднее 15 сентября 2020 года.

Риск неполучения РФФИ Договора в срок до 15 сентября 2020 года несет победитель конкурса.

При непредставлении победителем конкурса в РФФИ оформленного в соответствии с Инструкцией Договора в срок до 15 сентября 2020 года РФФИ вправе отказаться от заключения Договора.

6.9. РФФИ предоставляет грант только после заключения Договора.

6.10. Договор заключается на весь срок реализации проекта.

6.11. По результатам проведения экспертизы промежуточного отчета РФФИ принимает решение о целесообразности продолжения реализации проекта.

7. Правила реализации проекта и использования гранта

7.1. Замена аспиранта, Организации, перенос даты начала реализации проекта и продление сроков реализации проекта не допускаются.

7.2. Организация обязана на период реализации проекта оформить трудовые отношения с аспирантом в соответствии с действующим законодательством.

7.3. Победитель конкурса обязан:

7.3.1. До подачи промежуточного отчета о реализации проекта получить регистрационный номер темы проекта в ЕГИСУ НИОКР (ФГАНУ ЦИТиС) и внести его в КИАС РФФИ;

7.3.2. Обеспечить государственный учет результатов работы по проекту в ЕГИСУ НИОКР (ФГАНУ ЦИТиС).

7.4. Аспирант обязан:

7.4.1. по результатам первого этапа реализации проекта (до подачи отчета о реализации первого этапа проекта) подготовить не менее одной статьи для публикации в издании, включенном в одну из систем цитирования (библиографических баз) Web of Science, Scopus или в перечень ВАК;

7.4.2. по окончании второго этапа реализации проекта (до подачи отчета о реализации второго этапа проекта) опубликовать не менее одной статьи издании, включенном в одну из систем цитирования (библиографических баз) Web of Science, Scopus или в перечень ВАК;

7.4.3. в течение срока реализации проекта принять очное участие в научном мероприятии с докладом по результатам реализации проекта;

7.4.4. при опубликовании результатов реализации проекта ссылаться на поддержку РФФИ с указанием номера проекта. Например: «Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-31-70001» или ««The reported study was funded by RFBR according to the research project № 20-31-70001».

В российских изданиях, индексируемых международными базами данных и индексами научного цитирования, ссылка на поддержку РФФИ должна быть приведена на русском и английском языках. В этом случае образец ссылки на поддержку РФФИ

1) на русском языке: «Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-31-70001»;

2) на английском языке:

- если издание имеет англоязычные разделы «Acknowledgments» или «Funding», ссылка на поддержку на английском языке должна быть приведена в этих разделах, образец ссылки: «The reported study was funded by RFBR, project number 20-31-70001»;

- если издание не имеет англоязычных разделов «Acknowledgments» или «Funding», ссылка на поддержку должна предваряться этими словами, образец ссылки: «Acknowledgments: The reported study was funded by RFBR, project number 20-31-70001» или «Funding: The reported study was funded by RFBR, project number 20-31-70001».

7.5. Победитель конкурса обязан представить в отчете за второй этап реализации проекта сведения о двух статьях в журналах, опубликованных в течение срока обучения в аспирантуре в индексируемых в международных базах данных, автором или соавтором которых является аспирант. Если публикации были подготовлены по результатам реализации проекта, в них должна содержаться ссылка на поддержку РФФИ по правилам, указанным в пункте 7.4.4.

7.6. В течение года после окончания второго этапа реализации проекта диссертация на соискание ученой степени кандидата наук, подготовленная аспирантом, должна быть принята к защите диссертационным советом.

7.7. За счет средств гранта допускается осуществление следующих расходов:

7.7.1. на командировки аспиранта, связанные с реализацией проекта;

7.7.2. на организационные и регистрационные взносы за участие в мероприятиях аспиранта с целью представления результатов реализации проекта;

7.7.3. по договорам на предоставление редакционно-издательских услуг;

7.7.4. по договорам на оказание услуг по организации питания животных и на ветеринарное обслуживание животных;

7.7.5. по договорам на изготовление экспериментального оборудования, карт, схем, диаграмм, эскизов, макетов и др. предметов;

7.7.6. по договорам на выполнение научно-исследовательских работ;

7.7.7. по договорам на выполнение опытно-технологических, геолого-разведочных, пуско-наладочных работ, технического обслуживания и текущего ремонта научного оборудования, приборов, вычислительной техники;

7.7.8. на приобретение научных приборов, оборудования, в т.ч. флеш-карт (компьютеры, ноутбуки, планшеты, электронные книги и т.п. относятся к оборудованию), запасных частей, комплектующих к научному оборудованию, приборам, вычислительной и оргтехнике, расходных материалов;

7.7.9. на приобретение медикаментов, перевязочных средств и прочих лечебных препаратов, мягкого инвентаря и обмундирования, спальных мешков, специальной одежды и специальной обуви, средств космической связи, горюче-смазочных материалов и т.д. ;

7.7.10. на приобретение подопытных животных и продуктов питания для этих животных, биологических объектов для экспериментов и т.д.;

7.7.11. на приобретение средств, обеспечивающих безопасность при реализации проекта;

7.7.12. на приобретение научно-технической литературы по проблематике проекта (кроме библиотечных фондов);

7.7.13. на подписку научной литературы по тематике проекта, получение доступа к электронным научным информационным ресурсам;

7.7.14. на приобретение неисключительных (пользовательских), лицензионных прав на программное обеспечение, приобретение и обновление справочно-информационных баз данных;

7.7.15. на опубликование результатов реализации проектов, оформление прав на результаты интеллектуальной деятельности;

7.7.16. на использование ресурсов центров коллективного пользования (ЦКП) при реализации проекта;

7.7.17. на оцифровку и ксерокопирование архивных материалов;

7.7.18. на заработную плату аспиранта в период реализации проекта, включая все предусмотренные законодательством налоги и обязательные платежи;

7.8. Расходование денежных средств по направлениям 7.7.1-7.7.18 допускается только на цели, связанные с реализацией проекта.

7.9. Заработная плата аспиранта должна быть не менее 25 тысяч рублей в месяц (за исключением периодов нахождения в отпуске и периодов временной нетрудоспособности).

7.10. В случае нарушений Условий конкурса РФФИ может потребовать возврат денежных средств за весь срок реализации проекта.

8. Правила предоставления отчетности

8.1. Отчеты Организации о реализации проекта оформляются научным руководителем аспиранта путем заполнения электронных форм в КИАС РФФИ в срок, указанный в пп.8.3.- 8.4. в соответствии с Инструкцией по предоставлению отчета, являющейся неотъемлемой частью Условий конкурса.

8.2. Порядок оформления и подачи отчета регламентируется Инструкцией по предоставлению отчета.

8.3. Отчет за первый этап реализации проекта должен быть сформирован и подписан в КИАС РФФИ в срок:

Дата и время начала подачи отчетов: дата начала реализации проекта, указанная в Договоре, +1 года 15:00 (МСК)

Дата и время окончания подачи отчетов: дата начала подачи отчетов +30 календарных дней 23:59 (МСК)

8.4. Отчет за второй этап реализации проекта должен быть сформирован и подписан в КИАС РФФИ в срок:

Дата и время начала подачи отчетов: дата начала реализации проекта указанная в Договоре, +2 года 15:00 (МСК)

Дата и время окончания подачи отчетов: дата начала подачи отчетов +30 календарных дней. 23:59 (МСК)

8.5. Итоговый отчет должен быть представлен в КИАС РФФИ в срок до 23 часов 59 минут (МСК) даты завершения обучения в аспирантуре +1 год.

9. Установление результата предоставления гранта.

9.1. Установление результата предоставления гранта осуществляется на основании экспертизы отчета за соответствующий этап реализации проекта.

9.2. Конкурсная комиссия принимает решение об утверждении отчетов за первый и второй периоды реализации проекта на основании экспертизы отчетов и предложений экспертного совета РФФИ.

9.3. Необходимым условием утверждения итогового отчета является решение соответствующего диссертационного совета о приеме диссертации на соискание ученой степени кандидата наук, подготовленной аспирантом, к защите.

9.4. Обязательства победителя конкурса по реализации проекта и использовании гранта считаются исполненными после утверждения конкурсной комиссией итогового отчета о реализации проекта

9.5. За нарушение целей, условий и порядка предоставления гранта победитель конкурса несет ответственность предусмотренную Договором и законодательством Российской Федерации.

9.6. При выявлении нарушений Правил реализации проекта и использования гранта, Правил предоставления отчетности или условий Договора, РФФИ потребует возврат гранта.

Рабоат над проектом

В целом исследование идет в соответствии с утвержденным календарем. По проекту была выполнена на 50% работа по формированию набора данных (рус. датасет, англ. dataset), включающая себя тексты публикаций СМИ, научных учреждений, словарей и прочих данных. Были использованы материалы следующих веб-ресурсов:

- https://edersaas.ru/
- http://kyym.ru/
- http://adictsakha.nsu.ru/corpora/corp
- http://www.sakhacorpora.ru/
- http://vlab.ayaal.ru/

Формирование датасета — это основополагающий и наиболее затратный по временны́м ресурсам этап перед непосредственно созданием модели искусственной нейронной сети.

Одновременно данные в датасете формализуются, очищаются, убираются различные аномалии, производится орфографическая корректировка слов в нём. Для хранения и обработки данных на данный момент используется оборудование университета. Планируется закупка оборудования на грантовые средства, когда появится необходимость в создании и обучении нейронной сети (этап II в календаре исследования).

Проведена работа по определению методов и подходов токенизации слов, выдающие удовлетворительное качество и скорость при работе нейросети сверточного типа. Определены оптимальные для данного исследования вид и реализация нейронной сети, подходящей для NLP (англ. Natural Language Processing, рус. обработка естественного языка) - сверточная на основе технологии Tensorflow. Результаты буду опубликованы в будущих научных работах.

О проекте

Содержание Проекта
4.1.1.Цели и задачи исследованийЦель проекта – создание токенизированного набора данных для машинного обучения, основанного на текстах на якутском языке.
Задачи (I этап):
1. Определить подходящий метод токенизации текстов на якутском языке;
2. Определить оптимальные для данного проекта вид и реализацию нейронной сети, подходящей для NLP (англ. Natural Language Processing, рус. обработка естественного языка);
3. Сегментировать и обработать набор данных токенов с помощью выбранной технологии искусственной нейронной сети.
Задачи (II этап):
1. Подготовить базу данных токенизированных значений якутских слов, весов, векторов и связей токенов для использования в популярных реализациях нейросетевый технологий (TensorFlow и .NET ML);
2. Создать прототип продукта на основе выполненного проекта как демонстрацию проделанной работы.
4.1.2.Направление из Стратегии научно-технологического развития Российской Федерации (при наличии) (выбор из справочника)1. Переход к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и искусственного интеллекта
4.1.3.Анализ современного состояния исследований в данной области (приводится обзор исследований в данной области со ссылками на публикации в научной литературе).В современную эпоху глобализации как никогда важным становится сохранение этнических языков и культуры небольших народов менее 0.1-10 миллионов человек. Язык – основа культуры и идентичности народа, и исчезновение языка в абсолютном большинстве случаев является потерей этноса. Ученые предсказывают исчезновение языков, не получивших распространения [1].

Одним из способов «укрепления» языка и увеличение числа его носителей является его перенос в цифровой вид: оцифровка трудов (в т. ч. образовательных) на этом языке; внедрение его алфавита и текстов в популярные сервисы, предоставляемые ИТ-гигантами (например, в сервисы перевода с одного языка на другой, в цифровые клавиатуры, в приложения и программы для устройств, в качестве языка интерфейса для программных продуктов); предоставление API (англ. Application Programming Interface, рус. программный интерфейс приложения) для разработчиков популярных Интернет-сервисов.

Якутский язык в данное время начинает активно цифровизироваться, отмечаясь в следующих технологиях и продуктах:
1. Этот язык включен в Mozilla Common Voice для распознавания речи [2] // 2019;
2. В переводчике сервиса «Яндекс»[4] // 2020;
3. В цифровых клавиатурах мобильных устройств[3].
Однако существует проблема отсутствия необходимых инструментов и наборов данных для работы с текстами на якутском языке как в свободном доступе, так и в платных продуктах для разработки. Все вышепредставленные продукты, использующие язык, не предоставляют полноценного доступа к наборам данных (англ. dataset, рус. датасет), подходящих для тренировки искусственных нейронных сетей и машинного обучения. Без такого доступа и без такого датасета невозможно создать конкурентный продукт, ориентированный на якутский язык, на какой бы рынок он бы ни был нацелен. Для дальнейшего внедрения языка в «цифру» и устойчивого развития требуется именно такой датасет, который может быть использован любым разработчиком для внедрения языка в продукты.

Под «продуктом» имеется в виду любая образовательная, научная, коммерческая, некоммерческая, государственная, открытая, закрытая и иная разработка, возможно, вышедшая на рынок или работающая в том или ином секторе экономики, в т. ч. по программе «Цифровая экономика». Результаты проекта будут интересны для его адаптации на языки народов, проживающих территории Российской Федерации и вне ее, языки которых принадлежат тюркской языковой группе. Это так же поможет переносу их языков в цифровые сервисы в сети Интернет и увеличению носителей их письменности.

Список литературы и ссылки:
1. Cenoz J., Gorter D. Minority languages and sustainable translanguaging: Threat or opportunity? //Journal of Multilingual and Multicultural Development. – 2017. – Т. 38. – №. 10. – С. 901-912.
2. https://voice.mozilla.org/sah/speak
3. https://vk.cc/aw304v 4. https://rg.ru/2020/04/27/reg-dfo/iandeksperevodchik-stal-raspoznavat-iakutskij-iazyk.html
4.1.4.Предлагаемые подходы и методы, их обоснование для реализации цели и задачи проекта (Развернутое описание для оценки соответствия подходов и методов поставленным целям и задачам проекта)Среди методов токенизации любого текста выделяют следующие:
1. Токенизация по предложениям;
2. Токенизация по словам;
3. Токенизация по подсловам.
Первое используется для определения «настроения» текста, вектора его направленности и прочих параметров, абстрактных от отдельного слова. Второе необходимо для обозначения слова как отдельной языковой единицы, оно нужно для дальнейшего создания базы данных токенизированных слов. Третье используется для обозначения других элементов текста, лемматизации и стемминга (чтобы привести все встречающиеся словоформы к одной, нормальной словарной форме по падежам, склонению, лицу, суффиксам, префиксам или другим модификаторам).

Сама по себе токенизация – не единственный, но самый популярный и общепризнанный метод сегментирования текстов [1]. Нами будет использовано все три метода, необходимых для качественного создания базы данных. Описанные способы использовались, например, для токенизации текстов на языке Урду [2]. По итогу мы будем использовать самые популярные методы, наборы библиотек, языки программирования и технологии для получения качественного результата.

Так как якутский – язык из тюркской языковой семьи, то логично изучить и по возможности использовать труды ученых и разработчиков, работавших с любым тюркским языком[3][4], однако в связи с тем, что язык – предмет проекта использует кириллицу, могут возникнуть трудности в переносе результатов этих проектов в специфику нашего проекта.

Список литературы и ссылки:
1. Vijayarani S. et al. Text mining: open source tokenization tools-an analysis //Advanced Computational Intelligence: An International Journal (ACII). – 2016. – Т. 3. – №. 1. – С. 37-47.
2. Usman M. et al. Urdu text classification using majority voting //Int. J. Adv. Comput. Sci. Appl. – 2016. – Т. 7. – №. 8. – С. 265-273.
3. Güngör O., Üsküdarlı S., Güngör T. Recurrent neural networks for Turkish named entity recognition //2018 26th Signal Processing and Communications Applications Conference (SIU). – IEEE, 2018. – С. 1-4.
4. Aydoğan M., Karci A. Improving the accuracy using pre-trained word embeddings on deep neural networks for Turkish text classification //Physica A: Statistical Mechanics and its Applications. – 2020. – Т. 541. – С. 123288.
4.1.5.Ожидаемые результаты и их научная значимость (развернутое описание для экспертизы результатов и оценки оригинальности и новизны ожидаемых результатов)1. Будет создана база данных (БД) объемом не менее 100 мегабайт, содержащая токенизированные значения слов, предложений, подслов. Упомянутая БД будет содержать не менее 30 000 вхождений;
2. Будет создан API (англ. Application Programming Interface, рус. программный интерфейс приложения) для интеграции данной БД разработчикам на Tensorflow и .NET ML в виде пакетов pip и NuGet соответственно, а также программных адаптеров при необходимости;
3. Якутский язык станет первым тюркским языком с кириллическим алфавитом, который имеет в открытом доступе все необходимые API для создания любых продуктов, использующих нейронные сети, машинное обучение в составе искусственного интеллекта (ИИ), что даст толчок популяризации и сохранению языка и положит начало технологиям, работающим с языками других народов, использующих кириллицу;
4. По проекту будут опубликованы научные труды в количестве двух научных статей в журналах и сборниках из списка ВАК.
4.1. По результатам первого этапа реализации проекта будет опубликована как минимум одна работа, входящая в перечень ВАК;
4.2. По окончании второго этапа реализации проекта будет опубликовано не менее одной статьи в издании, включенном в перечень ВАК;
5. Будут созданы методические рекомендации с определениями набора программного обеспечения, методов и схем работы токенизации и сопутствующих программных процессов, необходимых для создания базы данных, подобной нашей.
4.1.6.Общий план исследований на весь срок реализации проекта (развернутое описание для оценки реализуемости заявленного плана и рисков его невыполнения)1. Подготовка исследования (1 этап выполнения);
2. Определение методов токенизации текстов на якутском языке;
3. Подготовка публикации по итогам первого этапа реализации проекта;
4. Публикация статьи;
5. Создание базы данных токенизированных значений слов якутских текстов как результата исследования (2 этап выполнения);
6. Подготовка публикации по итогам второго этапа реализации проекта;
7. Публикация статьи.
4.2.1.Научный задел научного руководителя аспирантаНаучный руководитель аспиранта имеет большой опыт работы по математическому моделированию, численным методам и комплексам программ, имеет 19 научных работ, 14 из которых опубликованы в научных изданиях, индексируемых в международных наукометрических базах данных в Web of Sciences / Scopus. За успехи в науке в 2018 г. получил стипендию Президента РФ.

В 2019 выиграл Грант Российского научного фонда «Проведение инициативных исследований молодыми учеными» президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными. Принимал участие более чем в 8 научно-исследовательских работах по государственным контрактам и грантам по линиям финансирования Минобрнауки РФ, Российского научного фонда, Российского фонда фундаментальных исследований, в том числе дважды — в качестве руководителя НИР.
4.2.2.Педагогический задел научного руководителя аспирантаНаучный руководитель аспиранта является сотрудником института математики и информатики СВФУ им. М.К. Аммосова с 2012 года. За все годы работы в университете провел различные лекции и семинары на кафедре "прикладная математика и информатика" и научно-исследовательской кафедре "вычислительные технологии".
4.2.2.1.Общее количество аспирантов, руководство которыми осуществлял научный руководитель аспиранта4
4.2.2.2.Из них количество завершивших обучение в аспирантуре1
4.2.2.3.Из них количество защитивших диссертацию на соискание ученой степени кандидата наук0
4.2.3.Список основных публикаций научного руководителя аспиранта, в журналах, включенных в одну из систем цитирования (библиографических баз) Web of Science, Scopus, РИНЦ, или монографии (не менее 5)1. Vasilyev A., Antonov, M., Popinako, A., Naumenkova, T. MD simulation of dynamics and transport in 5-HT3 receptor: LB-150 //The Febs Journal. – 2015. – Т. 282. (SJR 2.202, Q2)
2. Antonov, M. Y., Popinako, A. V., Prokopiev, G. A., Vasilyev, A. O. Numerical Modelling of Ion Transport in 5-HT3 Serotonin Receptor Using Molecular Dynamics //International Conference on Numerical Analysis and Its Applications. – Springer, Cham, 2016. – С. 195-202. (SJR 0.369, https://doi.org/10.1007/978-3-319-57099-0_19, Q3)
3. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Algorithms for Numerical Simulation of Non-stationary Neutron Diffusion Problems // International Conference on Numerical Analysis and Its Applications, Springer. – 2016. – Vol.10187. – P. 212-219. (SJR 0.369, https://doi.org/10.1007/978-3-319-57099-0_21, Q3)
4. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Solution of the Neutronics Code Dynamic Benchmark by Finite Element Method // AIP Conference Proceedings / AIP Publishing. – Vol. 1773. – 2016. – P. 110003. (SJR 0.182, https://doi.org/10.1063/1.4965007)
5. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Spectral properties of dynamic processes in a nuclear reactor // Annals of Nuclear Energy. – 2017. – Vol. 99. – P. 68-79. (SJR 1.566, https://doi.org/10.1016/j.anucene.2016.09.021, Q1).
6. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Numerical modeling of neutron diffusion non-stationary problems // Matematicheskoe Modelirovanie. – 2017. – Vol. 29. – №. 7. – P. 44-62.
7. Vabishchevich P.N., Vasil’ev A.O. Time step selection for the numerical solution of boundary value problems for parabolic equations // Computational Mathematics and Mathematical Physics. – 2017. – Vol. 57. – P. 843-853. (SJR 0.475, https://doi.org/10.1134/S0965542517020142, Q2)
8. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Solution of the 3D Neutron Diffusion Benchmark by FEM // International Conference on Large-Scale Scientific Computing. – Springer, Cham. – 2017. – P. 435-442. (SJR 0.369, https://doi.org/10.1007/978-3-319-73441-5_47, Q3)
9. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Modelling dynamic processes in a nuclear reactor by state change modal method // Journal of Physics: Conference Series. – IOP Publishing. – 2017. – Vol. 937. – №. 1. – P. 012003. (SJR 0.221, https://doi.org/10.1088/1742-6596/937/1/012003, Q3)
10. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Automatic Time Step Selection for Numerical Solution of Neutron Diffusion Problems // International Conference on Finite Difference Methods. – Springer, Cham, 2018. – P. 145-152. (SJR 0.369, https://doi.org/10.1007/978-3-030-11539-5_14, Q3)
11. Vabishchevich P., Vasilev A. Algorithm of time step evaluation for numerical solution of boundary value problem for parabolic equations // AIP Conference Proceedings. – AIP Publishing, 2018. – Vol. 2025. – №. 1. – P. 100010. (SJR 0.182, https://doi.org/10.1063/1.5064939)
12. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. State change modal method for numerical simulation of dynamic processes in a nuclear reactor // Progress in Nuclear Energy. – 2018. – Vol. 106. – P. 240-261. (SJR 1.12, https://doi.org/10.1016/j.pnucene.2018.02.027, Q1)
13. Avvakumov A. V., Strizhov V. F., Vabishchevich P. N., Vasilev A. O. Numerical calculation of spectral problems in SP3 approximation by FEM // Journal of Physics: Conference Series. – IOP Publishing, 2019. – Vol. 1392. – №. 1. – P. 012076. (SJR 0.221, https://doi.org/10.1088/1742-6596/1392/1/012076, Q3)
4.3.1.Список основных (не менее 1) публикаций аспиранта в изданиях, включенных в одну из систем цитирования (библиографических баз) Web of Science, Scopus или в перечень ВАК1. Сорочинский М. А., Иванов И. П. Система бронирования аудиторий как часть электронной образовательной среды вуза // Концепт. – 2017. – №. 10.
4.3.2.Научный задел аспиранта по тематике проектаАспирант является первым студентом, защитившим дипломную (диссертационную) работу к стартап-проект (2018 г., окончание магистратуры). Опубликовал 39 научных работ, из которых более 25 относятся к РИНЦ, 1 – к ВАК. Является стипендиатом научной программы «Google Developer Challenge Scholarship», по результатам которой освоил технология машинного обучения на основе .NET ML и TensorFlow. На его счету множество проведенных семинаров и лекций по научной тематике искусственного интеллекта в качестве студента-партнера Microsoft (2016-2020) и председателя Студенческого Научного Общества СВФУ своего факультета (2014-2019).

По тематике проекта опубликовал работы, связанные с искусственным интеллектом и лежащим в его основе технологиям нейронных сетей и машинного обучения:
1. Иванов И. П. Повышение скорости исполнения кода JavaScript с помощью технологии WebAssembly // Концепции устойчивого развития науки в современных условиях. – 2017. – С. 36-37.
2. Сорочинский М. А., Иванов И. П. Система бронирования аудиторий как часть электронной образовательной среды вуза // Концепт. – 2017. – №. 10.
3. Иванов И. П. Концепция" реактивного" форума на основе подхода REST/WebSocket/GraphQL // Научные тенденции: Вопросы точных и технических наук. – 2017. – С. 18-21.
4. Иванов И. П. Автономные и мобильные дата-центры в условиях освоения Арктики: проблемы и перспективы // Человеческий ресурс как фактор развития Арктики и северных территорий: сборник материалов МНПК,[Науч. ред. Н.В. Малышева]. – г. Якутск: Издательский дом СВФУ, 2018.
5. Иванов И. П. Анализ современных тенденций предоставления ПО на клиентских устройствах для физических лиц // Концепции устойчивого развития науки в современных условиях. – 2017. – С. 37-40.
4.3.3.Дата зачисления в аспирантуру2018-09-01
4.3.4.Срок обучения в аспирантуре4 года
4.3.5Было ли длительное (год и более) прерывание срока обучения в аспирантуре (академический отпуск, отпуск по уходу за ребенком и т.д.)нет
4.3.5.1.Продолжительность 
4.4.Планируемая дата начала реализации проекта2020-09-01
4.5.Планируемая дата окончания реализации проекта2022-09-01

Contact

  • Twitter
  • Facebook
  • Instagram
  • GitHub

© Информация о грантовом конкурсе и проекте конкурса. Создан на: Gatsby.js