Бригадир Юрий Алексеевич : другие произведения.

Работа с текстом для правильных пацанов, часть 1

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


Оценка: 6.57*9  Ваша оценка:
  • Аннотация:
    Сорри, картинки пока добавляются ))))

  Работа с текстом для правильных пацанов
  Технические аспекты от Бригадира
  
  Когда начинаешь писать от нехуй делать или, наоборот, чисто потому, что наезжают - об этом не задумываешься. Вообще. Потому что текстов твоих - два спизженных в Интернете реферата, объяснительная про драку в общежитии и стих для коллеги на день рождения. Там рифмы типа "Лена-колено", а также "сиська-писька", чего не жалко ни разу. Ежели все это исчезнет - никто не застрелится.
  Но потом как-то текстов становится больше. Диплом. Эта... диссертация. А ведь она, зараза - не одним куском, а мелкими файлами общим числом штук так двести. Плюс картинки. Плюс графики. Плюс эээ... ну, то что ты опять же спиздил в Интернете у других ученых. Плюс то, что не спиздил, а просто дали. Плюс сосканированное что-то с пометкой "авось пригодится". Плюс ты еще читаешь, когда нет работы. Ну там - Кастанеду. Красну Бурду. Бергсона. "Чешежопицу". Мулдашева. Блока. "Засыпающий сон, зацветающий цвет"...
  Я сейчас не выдумывал. Именно в таком порядке были прочитаны последние тексты, и не ебет меня ни разу - как это стыкуецца с окружающей действительностью. Мозг захотел - мозг получил. Ему все едино. После этого он вдогонку просмотрел "Одновременно" Гришковца (полностью) и какую-то германскую порнуху (частично). Потом он уснул. Он-то уснул, а я еще без него чертил чертежи в чертежной программе, сильно сорри за тройную тавтологию.
  Ну вот. Блише к теллу, как говорят прибалты. Накопилось за годы текстов - хуева гора. Не поддающаяся разумному объяснению. Потому что ни в жизнь мне не прочитать 9 гигабайт файлов во всевозможных текстовых форматах. А это вот столько на моих винтах, да еще и бессистемно. Если кто помнит - распиздяй я. Отчаянный.
  А если что найти надо в этой куче? Нда... Вы знаете - иногда проще найти в Яндексе, чем у меня на жестких дисках. Что и приходится делать. Считаем это проблемой номер раз, описываем ее кратко - "Настоятельная необходимость каталогизации (читай - поиска) информации на моем компьютере, а равно и в моей домашней сети" - и идем дальше. Забегая чуть в переулок - сеть дома, в пределах одной квартиры, есть не роскошь, а средство разруливания внутрисемейных конфликтов. Потому как при наличии всего одного компьютера начинается драка, смысл которой сводится к фразе "а теперь моя очередь"! Отчего один сидит, а остальные зляцца. Я эту проблему решил кардинально, ибо в каждой комнате по компу (не сильно, впрочем, крутому), и шлюз с сервером в кладовке, что обеспечивает выход всем в Интернет и равно и в местную сеть, полную софта, порнухи и музыки. Итого в квартире имеется 6 штук компьютеров, из них два без мониторов (файловый сервер и шлюз). Если вы думаете, что это стоило сумасшедших денег - не думайте. Все это говно можно нагрузить вилами в ближайшей конторе, которая торгует подержанными комплектующими практически за бутылку водки. Ну, две. Надо лишь помнить, что для подавляющего количества задач подойдет любой динозавр с процессором не быстрее 500 герц и памятью не больше 128 мегабайт. Если все файло слить на один более-менее современный комп, обозвать его сервером и смотреть-слушать-читать с него - то щасте есть. А шлюз... Это вообще может быть хоть первый пень на FreeBSD, не требующий никакого ухода годами, окромя косметического. Если настроен, конечно, правильно.
  Хм. Сын сказал, правда, что это не компьютеры, а калькуляторы, а лично он хочет такую видеокарту, каковая равняется стоимости всего этого хозяйства. А пусть купит. Я ж не против. Охуенный смайл. Молодым везде у нас дорога. Старикам всегда у нас Атлон. Эээ шестьдесят четвертый. И не ебет.
  Теперь, значит, опять тексты, ибо отвлекся. Писать приходится не только для себя (что понятно), но и для других. И везде свои правила. Одним надо в HTML. Другим в DOC. Третьим в RTF. Четвертым, однако, в PDF.
  Но ведь и это не все. Пока я писал чисто для себя - я не знал, что есть длинные тире. Вот вы знаете? И я не знал. А еще есть правильные кавычки ("елочки") и неправильные - эээ... ну, которые, как два головастика сверху. А еще надо абзацный отступ делать Tab"ом и никак иначе.
  Не запоминайте. Потому что это правила только одного издательства. У другого издательства они стопудово будут другие. И тоже вас удивят. Впрочем, когда вы будете сильно крутым писателем бестселлеров, то вам это все будет по такому барабану Страдивари, что и сказать неудобно. Поправят, подчистят, отсосут. А пока - придется слушаться. И выполнять требования. Или как вариант - нанимать корректора.
  Получается следующее. Одну и ту же книгу (анекдот, эссе, трилогию) надо будет разным эээ людям и организациям посылать в разных форматах, учитывая самые неожиданные правила. И, значит, требуется программа, которая все это может делать хорошо.
  Такой программы нихуя нету.
  А что делать?
  А пользоваться разными.
  Я этот путь более-менее прошел и подумал... Пиплов пишущих много, и кто-то также по моим стопам будет идти и всякое говно пробовать. Прогу за прогой, час за часом. Матерясь и отплевываясь. И захотелось просто помочь. Потому что для себя я проблему, условно называемую "Конвертация текста в почти любое говно по требованию быстро и хорошо", решил, чего и вам желаю.
  Третья проблема связана с моим личным распиздяйством кровными узами навсегда. Описываю.
  Вот у меня час времени и две рифмы, одна из которых - приличная. Пишу поэму. Ну, или поздравление. "Я желаю вам, Елена, парня с хуем по колено". И так 22 страницы. Или 222. Неважно. Нетленка, ептыть. Вот есть бестселлер, а это, скажем, бестридер.
  И тут, значит, звонок с работы. Юрий Алексеевич, вы не забыли, что сегодня рабочий день? Я?
  Да ни в жисть! Я тут дома удаленно вас, блядей, админю - аж вспотел. А что, собственно, случилось?
  Ну, слово за слово - однако, придется сходить и поработать. Скидываю файл на флэшку и бегу на работу. Там, конечно, проблема, но в железе и не в софте, а, как и в остальных 95 процентах случаев - в юзерах. Она, эта проблема, не лечится совсем, а только корректируется прямыми руками.
  Корректирую.
  А уже ж пришел. И какая, в пизду, разница, где мне нетленку писать? Пишу прямо на работе. Скинул файл на свой комп, открыл его и пишу. Тут звонит жена и говорит, что все пропало. Там, конечно, трагедь, но проблема, по сути, та же. В юзере, в жене то есть. И тоже не лечится, а только корректируется. Бегу домой.
  Корректирую.
  Попутно скидываю файл с флэшки на винт, не помня точно, скинул ли я на нее последний вариант нетленки. Дальше - флюктуация.
  В смысле - через несколько дней имею дохуя вариантов файла, совершенно не представляя, где какой. Они сохранены в разных Вордах - от 95-го до 2003-го, а несколько даже в Опен Офисе, и даже в Стар Офисе, и, само собой, в Блокноте. Хм.
  А тут, значит, Бог послал воскресенье. Хочу все разгрести. В пятницу с трудом все собрал в одну папку и имею реальную возможность заработать прогрессирующий геморрой мозга. В общем, очередную проблему можно описать как "Сравнение файлов по смысловому наполнению или набору слов или набору символов, что не всегда одно и тоже".
  Вообще говоря - почти в любом файловом менеджере можно сравнить два файла по содержимому и тут же сойти с ума от различий. Все дело в том, что с точки зрения того же файлового менеджера, содержание - суть набор нулей и единиц. А они будут сплошь и рядом разные, если вы, например, сохраните один и тот же файл в двух программах, не меняя текста. Например, в Блокноте и в Ворде. В этом очень показательном случае они будут отличаться как небо от земли, и не будут иметь ни одного совпадающего кусочка. Хотя текст, повторяю, один и тот же.
  Отчего проблема эта, несмотря на кажущуюся простоту очень нетривиальна. Смысл, блядь, математика описать не может. Зато побитовые отличия - как два пальца обоссать.
  Из этой проблемы вырастает дополнительная, суть которой - "Синхронизация, замена, добавление и удаление фрагментов текста".
  Можно, конечно, и не синхронизировать. Можно убить ненужный вариант и оставить нужный, но кто знает - где какой. Сначала же надо выяснить.
  Почему я это все объясняю?
  А потому что, дорогие мои, 80 прОцентов наших дОцентов лОжат докУменты в пОртфель, и только 20 процентов доцентов кладут в портфель документы. Другими словами - распиздяй не я один. А, скажем, подавляющее большинство населения. И ситуация эта сплошь и рядом повторяется с завидной, умопомрачительной, частотой. Много файлов. А где нужный? А хуй его знает! А вот еще два файла с такими же названиями! И еще пять. А кто их, блядь, рассовал по разным папкам, и где, блядь, тот, который я нюансил давеча на своей вилле?
  Никто не знает. Такова природа человека. Из прозрачной вещи сделать витраж и потом, нихуя не видя, ебаться в полумраке.
  Педанты, конечно, в социуме есть, как не быть. Мне приходилось видеть компьютеры, на которых все было так разложено по полочкам, что становилось откровенно стыдно за мои папки с названиями типа "Хрень", "Еще кака-то хрень", "Хрень вчерашняя, а также фотки с хепибёздея".
  У организованных людей и проблемы такой нету. Но я сейчас говорю об обычном пользователе, по пятницам напивающемся прямо в офисе в говнище, а в понедельник нихуя не соображающем, как минимум, до обеда. И причем, в офисе ему порядок хотя бы для видимости надо создавать, а дома ему шесть раз до пизды, в какой папке у него порнуха, а в какой - годовой отчет. Оттого дома на компе у него полный беспредел и проще, блядь, отформатировать, чем прибраться.
  Что, кстати, я не раз делал.
  А теперь, значится, решение вышеизложенных проблем.
  
  Каталогизация и поиск информации (в основном, текстовой) на обычном распиздяйском компьютере обычного распиздяя
  
  В общем, если включить индексацию в Windows, то это проблема как-то решается. Минус один, но огромный - эта штука жутко тормозит систему, практически не давая работать. Мазохисты идут вот сюда: Пуск - Выполнить, вбивают "services.msc", находят службу индексирования, включают ее и "тащацца".
  Немазохисты пытаются сделать немного по-другому и без крови. Программ для индексирования с последующим поиском много. Одна другой глючнее. Причем, ведь глючность проявляется лишь тогда, когда она нахуй не нужна - то есть на скоплениях файлов невъебенной (читай - жизненной) величины. Ну, например. У меня два диска общей емкостью 200 ГБ, заполненных на 150 ГБ. Редкая птица долетит до конца. В смысле - не каждая программа быстро и без потерь допилит в данном конкретном случае до последнего байта.
  Поиск разумнее и быстрее выполнять, начиная с названия файла или папки, а уже потом, если не помогло - заглядывая в содержимое файла, что резко увеличивает мировую скорбь, потом объясню почему.
  Эти задачи несколько разнятся, хотя и родственны, поэтому:
  1. Для поиска по названию файла (или папки) используем программу Locate версии 3.0.
  2. Для поиска по смыслу, то есть по содержащейся в тексте информации используем программу Архивариус 3000 версии не ниже 3.32
  Почему я не перечисляю другие популярные программы? А потому, что они не катят в моем, очень конкретном случае. В вашем - может они и заработают. Но одно совершенно точно - если у вас будет примерно 150 ГБ файлов, из которых 15 ГБ будут текстовыми, то лучше вы не найдете. Хуже - сколько угодно. Программ для поиска программисты наваяли дохуя.
  Итак, Locate. Весит меньше мегабайта, бесплатная. Индексирует 150 вышеупомянутых гигабайт за 8 минут, создавая базу размером 14 мегабайт, что совершенно не напрягает. Поиск происходит практически мгновенно.  []
  
  Если вы помните имя файла или папки хотя бы частично - то вот вам инструмент на каждый день и с вас литра пива.
  Мне.
  А вот если вы не помните имя - то задача сильно усложняется. И становится уже другой, нетривиальной, ресурсоемкой.
  Потому что надо, само собой, залезть в каждый файл и просмотреть его либо полностью, либо частично, что очень сильно замедляет процесс индексирования.
  Потом все, что просмотрено - запротоколировать и запомнить. Вроде ерунда. Если файлов два штуки. А если файлов более сто тысяч и весят они 15 ГБ? Простая логика показывает, что и база в таком случае будет сопоставима по размеру. Поэтому надо элементарно освободить место. И запастись терпением. Не на сутки, конечно, но все же. Хотя... и на сутки бывает. И больше, и гораздо больше тоже. Впрочем, будем пессимистами до мозга костей - приведем пример, и пусть нам станет страшно.
  Великолепная, без всякого сомнения, программа Sleuthhound! Pro, более известная, как Ищейка Проф версии 4.6.2 Deluxe, делает все, как надо. Результаты поиска сказочны. В принципе, такую же хрень мы видим, например, в Google или в Яндексе. Ввел - получи. И тыкай прямо на ссылки. Я с удовольствием попробовал ее на работе, где текстовых файлов у меня, нуждающихся, на мой взгляд, в индексировании около ста мегабайт. Я без труда выбрал эти папки, проиндексировал за разумное время и получил - чего хотел. Обрадовавшись подарку судьбы, я вечером добрался до дома и запустил программу уже там.
  Залупу. Когда я ей скормил не сто мегабайт, а 15 гигабайт текстов, Ищейка, даром что Проф, зависла тут же, ужаснувшись количеству. Ну, подумал я, уменьшу ей зону поиска. Уполовинил. Вывалилась на 10 секунде. Скормил ей папку на 5,5 гигабайт, и она, вздохнув, не спеша начала работать. Настолько не спеша, что я остановил ее к ебени матери, сделав нехитрые вычисления. По моим расчетам она должна была мотылять 5 часов, при этом нихуя не давая толком делать, а базу она обещала выдать размером 6,8 гигабайт, чего мне как-то не хотелось. Вполне допускаю, что база в конце, по каким-то там алгоритмам, должна была уменьшиться. Вполне допускаю, что Ищейка бы доковыляла, а потом сделала бы мне минет без наркоза. Вполне может быть, что с помощью нее я нашел бы смысл жизни или философский камень. Но пять часов - есть пять часов. В пизду.
  А так ведь это только одна из папок!!! А еще почти 10 гигабайт? Еще полдня жизни? Я понял одно - это хорошая программа. Для небольшого количества файлов. Скажем, для какого-нибудь смолл офиса, где просто не успели накропать тома нетленки. А у меня тут мировая литература представлена, если и не полностью, то уж неслабо и даже жутковато, ибо прочитать это все я смогу только если стану бессмертным горцем Мак Лаудом.  []
  
  Вооот. Вы, конечно, спросите меня - нахуя тебе столько книг? Вряд ли это правомерный вопрос. Это не мне. Это - ВООБЩЕ. Ну, для семьи, для гостей, для знакомых, родственников... Это - просто колодец, из которого будут черпать, кому надо. И кто-то обязательно что-то оттуда вытащит. Огонь, блядь, мерцающий в сосуде... Не напрасно ни зло, ни добро не пропало...
  А, ладно. Не в этом дело. Дело в том - как в этом всем искать. Хочется же. И, знаете, хочется искать именно в тексте. Внутри, так сказать. В мясе, в нервах, в смысле, в толщине чувств и глубине отношений. Там, сдается мне, не так уж много. Но и не мало.
  И тут нахожу я программу под названием Коперник. Хотя, что значит - нахожу. Знал я о ней, знал. Только не пользовался никогда. И программа, доложу я вам, хм... с изюминкой и рабочая на сто процентов и самое главное - настраивать ее практически не надо. Ну, то есть, заточенная она под пользователя, которому нюансы настройки в хуй не упирались, а лишь бы прога работала сразу, не отвлекала и ресурсов не жрала. Вот она и не жрет. Как это она так делает, спросите вы? Да очень просто. Она это... работает, пока вы, однако, курите, пьете, трахаете секретаршу и размышляете о вечном. То есть - когда вы не нажимаете кнопки вашего любимого компьютера. Хорошо? Хорошо. Вы - за дверь, а она индексировать. И никто никому не мешает. Красота.
  Теперя оборотная сторона. Ну, на работе она у меня все быстро проиндексировала. Собственно, я даже время не засекал. А дома... Я думаю - несколько дней Коперник проработает. А то и недель. И потом... Этот самый Коперник имеет философию виндового пользователя, которая, однако, звучит примерно так - "вы тока меня не трогайте". В смысле - она работает САМА, не требуя ВМЕШАТЕЛЬСТВА, и не отвечая за БАЗАР. Сидит, сука, себе в трее, индексирует, есть не просит, и не отсвечивает. Надо вам что-то найти - вводите вот сюда, в окошечко искомое и нажимайте либо зелену стрелку, либо Enter.  []
  
  
  Но вот вопрос... Сколько она уже проиндексировала? А сколько еще осталось. А каков будет размер базы? А сколько времени, хотя бы примерно, осталось до окончания индексации? Тишина на Ивановском кладбище... Никто не знает. Она будет работать вечно, когда-нибудь, конечно, проиндексирует все файлы и через определенное время опять начнет сызнова, но отчитываться перед вами она не будет ни за какие коврижки. Вообще, программа больше похожа на привидение, которому на время насрать в принципе. Я ее за этот похуизм оставил на какое-то, не очень большое, время. Она на ручей похожа. Или на осенний дождь. И это... Денег за нее не просят. Хоть в России все одно весь софт бесплатный, но приятно. Выбор папок
  И тут мне коллега в ухо орет: "А Гугля"? А что, говорю, Гугля? Это тот же хуй, только вид сбоку. Вот так вот выглядит окошко вбивания запроса в Google Desktop:  []
  
  
  
  А так аналогичная форточка в Copernic Desktop:  []
  
  
  
  Ну, и кто из них у кого спиздил? Мне, как пользователю этот вопрос не интересен ни разу. Работали бы обе проги по человечески - я бы, может, и обе оставил. А так - спихните в канаву и дайте мне другой револьвер.
  Следующая программа из бесплатных, достойная внимания однозначно - Двигун. Вернее, если написать по-нашему, по-бразильски, то - DVYGUN Smart Search версии 2.5.4.3 бета. Много программистских косяков. Общее впечатление - даже не бета, а альфа какая-то. Сырая, как арбуз. Пункт меню "Остановить индексацию" при нажатии никак не меняется, отчего не ясно - остановилась ли она реально. В окне выбора папок они показываются не по алфавиту, а как попало. В моем случае - от D до Z, потом вдруг от A до C. Такой вот у Двигуна странный английский алфавит. Русский не лучше. Бывают случаи, когда он вдруг правильно показывает. Отличие от Гугли с Коперником - можно насильно заставить ее индексировать всегда, а не тогда, когда комп простаивает. Настроек, по сути - ноль. Выбора кодировок нет (видимо - автоматом). Можно выбрать место базы, диски-папки для индекса и виды файлов (немного, но основные есть). Все. Однако... Она - работает! Эта спартанская программа въябывает и не отсвечивает! Она не зависает, как Ищейка. Она не считает компьютер своим, как Гугля с Коперником. И она не пищит, что база стала больше положенного, как Архивариус, о котором ниже.  []
  
  
  
  Возвращаемся к платным (читай - пижженым) продуктам.
  Программа Архивариус принципиально от Ищейки отличается тем, что быстрее индексирует. Шустрее ли она это делает, чем Коперник - узнать мне не захотелось. У них философии разные. Коперник - явно с Тибета. Ищейка - классическая немецкая, а Архивариус с Двигуном - однако, больше русские программы, где принцип такой - "хоть что-то, да не доделаем". Или как говорила одна моя знакомая - "хороший мужик, но пьет".
  Архивариус 3000 в демоипостаси нам нахуй не нужен. Там разрешено уж очень мало. И в этом "мало" он будет как часы работать. Впрочем, и Ищейка в деморежиме показывает великолепный результат. Вся ботва и весь геморрой начинается в настоящих, боевых условиях. А таковыми я лично считаю мой компьютер. Там, повторяю, 150 гигабайт файлов, из которых 15 гигабайт текстовых.
  Так вот, идем в Интернет и, не сильно напрягаясь, скачиваем пиратскую полнокровную версию Архивариуса 3000 под номером 3.16. Для справки - можно и купить. Персональная лицензия стоит 295 рублей. Но здесь не в жадности дело, а в менталитете. Его ни завтра, ни послезавтра никакими законными-подзаконными актами не отменить.
  Вооот. Запускаю. Чтобы "экскремент" был чистым, скормил я Архивариусу те же пресловутые 5,5 гигабайт файлов, которые пыталась переварить Ищейка, тоже не стал ждать до конца, а просто прикинул, что работать она собиралась 2 часа 15 минут, а базу собиралась выдать размером 6.8 гигабайт (столько же, сколько и Ищейка). А собственно, что тут удивительного? Да, алгоритмы индексирования разные, но ведь текст есть текст. Его, как и воду, сильно не сожмешь. Физика, блядь. В этом смысле на чудо не надейтесь. Хотите полноценный индекс - освободите место.
  Поскольку результаты поиска что у одной, что у другой программы очень близки, решил я остановиться на Архивариусе 3000, поскольку разница во времени индексирования огромная. 5 часов и 2 часа 15 минут. Более чем в два раза. Отгадайте - кто идет в сад после этого?  []
  
  
  
  Но вот подсунул я победившей программе чего положено и пошел кофе-водку пить. Прихожу. Буквально-дословно вижу следующее: "Indexing error: Size of Index Base can't exceed 1.5 GB. If you need more please make second Index Base". Другими словами - не может база быть больше 1,5 гигабайта, вот такое ограничение у проги. Блядь. Да будь у меня текстов всего 1,5 гига, я бы, возможно, и без программ разобрался! Я потому и хочу все это автоматизировать, что сам НЕ СПРАВЛЯЮСЬ!
  Посидел, подумал. Потыкал. Успокоился. Это ОДНА база не может быть больше 1,5 гигабайта. Так сделай несколько. Сделал. Ну что-то вышло. Блядь, как в России все любят недоделывать! Пойду к буржуям.
  У буржуев нашлась мощнейшая поисковая машина, под названием dtSearch версии 7.20, билда, не спиздеть, 7131-го. Где есть? Там же, где и все программы - в Интернете. "Яндекс! Найдёцца все"! Охуительный, однако, слоган.
  Вы, возможно, постарше-помоложе версию найдете - неважно. Они все работают замечательно.
  dtSearch - программа для профессионалов, в основном - программистов, работающих с оргомными залежами кодов на всевозможных языках. Так и написано маркетологами компании на старом добром английском - терабайты текста нам похуй. Причем, что в сети, что на винте, что в Интернете. Мгновенно, говорят, найдем, чего надо. Ну, мгновенно - это они пиздят, но то быстрее, чем другие - факт.
  Сама программа - продукт серьезный. Ищейка с Архивариусом в полной жопе, но ведь и стоят они куда меньше. Для справки - dtSearch самый мелкий вариант стоит 200 баксов, самый крутой 2500. Версии Ищейки с Архивариусом самые простенькие начинаются с 10-20, несильно подрастая с крутизной пакета. В России, повторяю, эти все варианты разнятся только по трафику. Ибо воруем всей страной, скрываем доходы всей страной и дружно вывозим бабло за рубеж. Хотя... Я вот не вывожу. Тут пропиваю. Большую часть жизни я бухаю водку новосибирского производства, и всего два раза был в реанимации. Что-то там не то в этот день в цистерну налили. Бывает. С другой стороны - никто не говорил, что водка в количестве двух бутылок на завтрак после вчерашнего банкета, есть полезный продукт вообще.  []
  
  
  
  Впрочем, это к делу не относится. Копая dtSearch все глубже и глубже, я стал испытывать некую двойственность впечатлений. Как скажем, перед случайной, незапланированной дракой, когда времени нет совершенно, но урод выпрашивает, и ты колеблешься - то ли дать в репу долбоебу, то ли, все-таки, сдержаться, поскольку есть дела важнее. О dtSearch можно отдельную портянку написать страниц на 50, поэтому я отчитаюсь только о том, как она хотела порвать на части троих конкурентов в тех же стандартных условиях.
  Прогон четырех лошадей по кругу. Вот, оцените:  []
  Вроде бы, с небольшими оговорками, dtSearch победила. Вроде бы... А теперь, значит, ложка дегтя.
  Есть такое штука в русском языке - морфология. Вообще-то, она в любом языке есть. Но в данном случае нас что интересует? Интересует нас, однако, окончание. Вот вводите вы в Архивариусе запрос по слову "жопа". И получаем все варианты типа "жопе", "жопу", "жопы" и так далее. dtSearch этого не может в принципе. Он прекрасно найдет отдельно "жопе" и отдельно "жопу". А все вместе - идите туда же, в то же место. Ну, ладно, в dtSearch есть окошко, в которое попадают родственные слова, по алфавиту близкие. Это не так страшно. Чуть напрягает, не более. Сильнее напрягает недопонимание программой разных кириллических кодировок. В том же Архивариусе их поддерживается аж 33, из них пять по умолчанию. dtSearch о кодировках, в принципе, знает. Можно выбрать 4 штуки. Но! Не все. А только одну из четырех! Или очень загадочный автодетект. Что он делает - никто не знает. Могу предположить, что он сильно-сильно любит win1251, но не буду божиться.
  Этот факт сильно снижает значимость мощнейшей, без всякого преувеличения, поисковой машины. Но больше всего лично меня добила неспособность программы хоть как-то заглянуть в CHM файлы! Она выдирает оттуда ровным счетом заголовок и нихрена более.
  Вот и думай. С одной стороны - богатейшие настройки, изощренные варианты запросов, практически мгновенный поиск, стабильность (!), способность переварить терабайтные залежи файлов (у меня таких нет, но я, почему-то, верю). С другой - английский интерфейс (мне-то до пизды, а вот, например, для жены это - форменная трагедия), незнание русской морфологии, кодировок, неспособность читать CHM... Плюс... В смысле - минус. Это конечно, не так страшно, но сказать хочется - недружественный, строгий, неэргономичный подход ко мне, любимому. В смысле - к юзерам. Как говорит мой близкий знакомый - "юзабилити ни в пизду". И он прав. Чтобы, например, добавить несколько папок в индекс - надо каждый раз открыть это ебучее окно заново, вместе с каждой папкой. В том же Архивариусе один раз открываем окно и просто ставим-убираем галочки. Вот вы думаете - хуйня, а когда папок штук 40 - очень хочется материться по-ихнему, по-английски.
  Послать ли dtSearch по этому поводу нахуй? Не спешите. Я-то пошлю, а вы подумайте. Вот почему. Если для вас английский (каковым является, по большому счету, любой язык программирования) - родной, то вы нашли то, что нужно. Мощнее нет. Устойчивей нет. Профессиональный инструмент, с которым вы будете спать и есть. А российскому писателю-ученому-журналисту такая махина ни к чему. Это примерно как в соседнюю деревню за водкой на 60-тонном Камацу ездить. Хотя я - ездил. Но это уже другая история.
  И еще. Мне лично представление результатов в Ищейке и Архивариусе показалось более привычным, интуитивным, ненапряжным, интернетоподобным, чем в dtSearch. Впрочем, привыкнуть к чему угодно я могу довольно быстро - был бы смысл. А его в данном случае нет.
  И, значит, еще один свисток в этой велогонке - в последней версии Архивариуса (на момент написания - 3.32-ой, которая еще не сломана, но крякеры, как вы знаете, никогда не спят) размер баз может быть более 4 гигабайт. Ну, этого следовало ожидать. А вот насколько более? Ну, не стал я думать. Купил я этот Архивариус, сделав один кульбит этического плана. Версия для студентов (с теми же возможностями) стоит дешевле. А у меня ж в семье есть студенты. И что изменится от того, что я куплю программу на их имя? Ну и купил. И пользуюсь И ниибет.
  День и ночь стоит она (программа) у меня на сервере и по расписанию индексирует. И, в общем, я доволен. Хотя... Все жду, когда появится более достойный продукт. Хотя... Я как-нибудь напишу статью об Архивариусе и вы поймете, что быть более достойным - очень сложно.
  А кто не хочет принципиально пользоваться купленным продуктом - ставьте Copernic Desktop Search версии 1.61, ай там - Google Desktop 2.0, либо Двигун 2.5.4.3 и будьте честными. Только не забудьте так же перед этим удалить с компа пизженную винду, офис, антивирус и вообще - весь нелицензионный контент. Хм.
Оценка: 6.57*9  Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"