Generative Programming Homework 1

Материал из SEWiki
Перейти к: навигация, поиск

1. Парсер упрощенного XML, срок сдачи до 15.09.2013
Написать на Textmapper (плагин к IntelliJ IDEA) парсер текста вида:


<asdf1>
<abc>text 123</abc>
<zxcv2> text text</zxcv2>
</asdf1>

Написать программу, использующую сгенеренный парсер. На вход программе подается файл с текстом. Программа выписывает в консоль полученное от парсера AST или выводит ошибки, возникшие при разборе (в случае, когда они есть). Как передается файл и как выводится дерево - не важно, главное, чтобы было понятно, как запустить программу, и что получилось в итоге.

Спецификация языка

  • Теги бывают вида <xyz> и </xyz>, но не <xyz/>
  • Внутри каждого тега может быть либо несколько тегов, либо один кусок текста. Текст состоит из слов, каждое из которых - набор букв. Имя тега - набор букв (без цифр). Корневой тег - ровно один
  • Теги должны образовывать правильную скобочную структуру. Hint: проверку соответствия идентификаторов открывающего и закрывающего тегов проще всего сделать через semantic actions (см. документацию).



Приблизительная разбалловка
5 - задание сделано и полностью работает
4 - небольшие недочеты, в целом все работает
3 - не работает в некоторых случаях
1 - задание не сдано


+1 балл - все то же самое, но имя тега может включать цифры и буквы, а текст внутри тега состоит из букв, цифр, точек, запятых и знаков пробелов, другие символы в тексте запрещены (см. lexer states в документации textmapper'а).
+1 балл - найти максимальное кол-во ошибок в Textmapper (5 лучших результатов по состоянию на 15.09)
Максимум за все задание можно получить 6 баллов


NB! Не забудьте отключить external build (File->Preferences->Compiler->Use external build -- disable) и написать в начале .tm-файла магические строчки:
gentree = true
genast = true
positions = "offset,line"
endpositions = "offset"