Ну, так на вскидку смущает только алгоритм, по которому был восстановлен файл.
Всё-таки информация в файлах, действительно, может пропасть кусками. Но куски чаще куда более крупные чем отдельные слова.
А за архив спасибо, ознакомлюсь. Благо когда-то участвовал в обсуждении этой темы на другом форуме (увы, смотрелка скачанных оттуда сообщений сломалась но как будет настроение починю и кину ссылку на посмотреть, номер темы 4466 если что) но тогда были именно 30 штук. Впрочем, ни к чем особо там и не пришли... Так то, вроде, существуют математические способы определить является ли набор символов текстом с помощью закона Ципфа. Но я слишком далёк от темы, что бы пытаться его применить.