1. Wielkie tabele w Excelu (na razie koło 200 wyrazów każde w około 16 formach)
2. Czasowniki: dopasowuję rdzeń, a następnie wyszukuję fragmenty typu "prze-", "z-", "-iłem" itp, Podstawowe czasowniki są wpisane w excelu (te które będą potrzebne do robienia zdań)
3. Liczby zapisane cyframi, URL'e, daty, czy E-Maile parsuję.
Teraz przerabiam to co mam na Django (Taki framework w Pythonie). Dla chętnych będzie API do rozmowy oraz API do syntezatora mowy. API do czytania i pisania zdań też będzie publicznie, ale zwykły śmiertelnik tego nie skuma. Będzie "inteligentny" system wstawek (W bazie jest "Teraz jest [TIME]", a rozmówca dostaje "Teraz jest 00:15") w odpowiedziach, przez co wiadomość będzie inaczej wyglądała w jabberze, czacie na stronie czy w mailu.
PS: Wiktionary się nie nadaje bo:
1. Nie idzie określić części mowy, na stronie często napisane jest słowo "rzeczownik" mimo że wyraz jest czasownikiem.
2. Nie ma odmiany
3. Tabele odmian wymagają znanej koniugacji, a nawet tego nie mam.
4. Walczyłem z tym i wierz mi że nie idzie.
http://beta.manfred.semantiq.eu/ <- nowy Manfred (Jeszcze nie działa, ale można popatrzeć)
http://manfred.semantiq.eu/ <- stary Manfred (już nie działa, EDIT: O! zaczął się odzywać!)
Ktoś chętny do tej odmiany?