Факултет по математика и информатика



Дата04.08.2017
Размер84.36 Kb.
#27211


Утвърдил: …………………..

Декан
Дата .............................

СОФИЙСКИ УНИВЕРСИТЕТ “СВ. КЛИМЕНТ ОХРИДСКИ”

Факултет по математика и информатика


Специалност: (код и наименование)






























Магистърска програма: (код и наименование)

М

И

И

3

8

2

1

1

3

Компютърна лингвистика

УЧЕБНА ПРОГРАМА

Ц

6

6

3

Дисциплина:

Представяне, извличане и търсене на  концептуални знания




Преподаватели: проф. дмн Галя Ангелова, докторант Ивелина Николова





Учебна заетост

Форма

Хорариум

Аудиторна заетост

Лекции

40

Семинарни упражнения

20

Практически упражнения (хоспетиране)




Обща аудиторна заетост

60




Извънаудиторна заетост

Подготовка на домашни работи

10

Контролни работи и подготовка за тях

20

Учебен проект




Самостоятелна работа в библиотека или с интернет ресурси

20

Доклад/Презентация

20

Подготовка за изпит

20






















Обща извънаудиторна заетост

90

ОБЩА ЗАЕТОСТ

150

Кредити аудиторна заетост

2

Кредити извънаудиторна заетост

3

ОБЩО ЕСТК

5






Формиране на оценката по дисциплината

% от оценката



Контролни работи






Участие в час






Домашни работи

20


Учебен проект

40


Тестова проверка

40


Текуша самостоятелна работа /контролно






Workshops {информационно търсене и колективно обсъждане на доклади и реферати)























Изпит – практика (решаване на задачи)





Изпит - теория

+/-10




Анотация на учебната дисциплина:

Традиционно човешкото знание се съхранява под формата на свободен текст, но при ускореното развитие на технологиите е очевидна необходимостта от структури-рани и явно-декларирани концептуални описания на обекти и явления в природните науки. В някои области като медицината най-важните номенклатури се изработват ръчно в продължение на десетилетия – такава е Международната класификация на болестите, поддържана от Световната здравна организация. В други области, обаче, ръчната изработка с постигане на консенсус се счита невъзможна поради високата си цена, динамиката на поява на знанието, различните контексти на използването му и липсата на традиции за унификация. В тези области се правят активни опити за автоматично извличане и структуриране на знания от текст на естествен език.

Целта на курса е да запознае студентите с основните понятия, подходи, пос-тижения и проблеми при автоматичното извличане на знания от текст. В увода се резюмират постулати за представяне на знанията в изкуствения интелект. Накратко се разглежда представянето на семантиката на текста в компютърната лингвистика и се прави разграничение между формалния модел на значението на текста и концептуалното знание за света. Разглеждат се техники за автоматично извличане на понятия и екземпляри, релации (отношения) и факти от текстове. Примерите са предимно върху текстове от Wikipedia, поради интереса към формализиране на нейното полу-структурирано съдържание. Упражненията са организирани с използване на публичен софтуер и решаване на различни задачи чрез него.




Предварителни изисквания:

Познаване на основните понятия от дискретната математика




Очаквани резултати:

Студентите, завършили успешно курса, ще разбират принципните постановки на автоматичното откриване на знания в текста и ще познават постиженията и затрудненията пред практическото решаване на тази задача.



Учебно съдържание/Конспект







ТЕМА

Хорариум лекции

1

Въведение – представяне на знанията в изкуствения интелект, постановка и начин за използване на базите знания

3

2

Съвременни представи за онтологии, езици за представяне на знанията в контекста на семантичния интернет. Използване на етикети на естествен език в концептуалните представяния

3

3

Значение на думите и семантика на изреченията в компютърната лингвистика. Тематични роли на глаголите като n-местни предикати. Логическа форма на изречението

3

4

Разширяване на WordNet с логически форми (Extended WordNet)

2

5

Обхват и отрицание, референция и методи за автоматичното й разрешаване в компютърната лингвистика. Разлика между формалната семантика на текста и онтологичните (концептуални) знания за света

3

6

Автоматично извличане на екземпляри – наименовани единици от текст и класифицирането им

3

7

Автоматично извличане на понятия от текст и свързването им в концептуални йерархии

3

8

Автоматично извличане на свойства на понятията от текст

3

9

Автоматично извличане на релации между понятия от текст

3

10

Автоматично извличане на събития от текст чрез свързване на концептуални единици, открити в различни изречения

3

11

Извличане на факти за пространствени и темпорални връзки между обекти

2

12

От текста към формализираното представяне: Wikipedia и DB-pedia

2

13

Извличане на семантична мрежа от Wikipedia

2

14

Резюме на състоянието, проблеми и предизвикателства

3

15

Ръчно изработване на номенклатури и класификации, ръчно дефиниране на логически изрази в SNOMED

2

Библиография

  • Allan, J. Natural Language Understanding, Benjamin/Cummings Publishing Company, 1995.

  • Учебници по изкуствен интелект, обзори по семантични мрежи – компилация от подходящи текстове

  • Многобройни статии за автоматично извличане на знания от текст, публикувани през последните 15 години

  • Материали на сайтовете http://xwn.hlt.utdallas.edu/about.html, http://dbpedia.org и др.



Дата: 24.01.2013 г.
Съставили: проф. дмн Галя Ангелова, докторант Ивелина Николова




Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница