1. Собирање на пишани ресурси
Во овој чекор беше потребно да се собере голем корпус од текст на четири различни дијалекти од македонскиот јазик. Текстот треба да биде генериран од различни раскажувачи, со цел добивање на целосна слика за дадениот дијалект. За таа цел добивме голема поддршка од МАНУ и обезбедивме скоро еднаква должина на текстови објавени како три збирки: „Така се зборува во Охрид“, „Така се зборува во Гостивар“ и „Така се зборува во Велес“. Четвртиот извор опфаќа поширока географска област и покрива неколку дијалекти од источниот дел на Македонија, вклучувајќи раскази од Кочани, Виница, Тиквешкиот регион, Радовишки регион, Струмички регион, итн.