<?xml version="1.0" encoding="windows-1251"?><?xml-stylesheet href="http://fit-media.com//css/rss.css" type="text/css" ?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
 <title>FIT-Media Blog</title>
 <link>http://fit-media.com/</link>
 <description>FIT-Media Blogging Engine</description>
 <language>ru</language>
 <image>
  <url>http://fit-media.com/i/fitmediablog.png</url>
  <title>FIT-Media Blog</title>
  <link>http://fit-media.com/</link>
 </image>


<item>
<title>Искать или не искать - вот в чем вопрос.</title>
<link>http://fit-media.com/post_1245195136.html</link>
<description>&lt;p&gt;&lt;img alt=&quot;&quot; width=&quot;200&quot; height=&quot;305&quot; align=&quot;left&quot; style=&quot;margin-right: 10px;&quot; src=&quot;/i/lisij.jpg&quot; /&gt;Все продукты Вадима Ласто в той или иной степени ориентированы на монетизацию. Заработок любыми средствами, удобство посетителей на втором плане - почти эталон спартанского минимализма в действии. Но жаловаться грех - хотите &amp;quot;рюшечек&amp;quot; - берите другой движок, благо их в сети навалом. И большинство даже раздаются бесплатно. Однако ж давайте поговорим о том, чем уже активно пользуемся - о Ласто-блоге и Ко.&lt;/p&gt;

&lt;p&gt;Как уже сказано, этот софт ориентирован в первую очередь на притягивание поискового трафика, а не на номинирование в конкурсе &amp;quot;Мега комфорт-2010&amp;quot;. Отсюда и весьма ограниченные удобства для пользователей. И это касается не столько владельцев сайтов, сколько посетителей. Например блог не обладает такой (практически ставшей уже стандартом для блогов) вещью как облако тэгов. И хотя скрипт имеет достаточно развитый механизм для автоматического наращивания количества страниц и создания лабиринта для поисковиков, облако тэгов в этом плане тоже не плохо смотрится. Но ко всему оно еще и очень удобно для пришедших серферов.&lt;/p&gt;

&lt;p&gt;Вторым заметным недостатком является поиск по сайту. Вот об этом и поговорим.&lt;/p&gt;

&lt;p&gt;Автора блога здесь винить не в чем, он и так сделал все достаточно грамотно, пытался соблюсти некий баланс удобства с ресурсопотребления. И вышло, надо сказать, довольно удачно. Но все же...&lt;/p&gt;

&lt;p&gt;Я думаю, что никто не станет спорить, что на сегодняшний день ни один более-менее крупный сайт (естественно &lt;u&gt;сделанный для людей&lt;/u&gt;) не может обойтись без качественной поисковой системы. Навигация по сайту - это основа удобства работы. И если посетители вашего сайта не могут найти на нем нужную им информацию, то не ждите от них благосклонности и уважения. А следовательно и повторных заходов.&lt;/p&gt;

&lt;p&gt;К слову сказать, серьезные сайты тоже страдают этой проблемой - кривым поиском. Частично проблему позволяет решить такая штука как &lt;u&gt;карта сайта&lt;/u&gt;. Но если ресурс действительно крупный (а даже средние блоги могут легко заиметь несколько сотен докуметов), то в карте сайта уже нет места для прописки каждой страницы - только разделы и секции, что не есть хорошо, т.к. серферы ленивы и капризны и если в первые две минуты они не смогли получить то, что хотят - поминай их как звали.&lt;/p&gt;

&lt;p&gt;Ситуация с созданием качественного поиска осложнена тем, что &amp;quot;великий и могучий&amp;quot; очень фигово поддается машинному анализу и построить серьезную поисковую систему весьма  трудоемко. Англоговорящим буржуям в этом смысле повезло гораздо больше - у них слова практически не изменяются и даже банальный LIKE в SQL-запросе способен дать вполне приемлемые результаты. Но вот с русским такая фишка не проходит - два слова, различающиеся всего одной буквой будут расценены как разные. Наши падежи, роды, времена, склонения, спряжения и прочие приставки-суффиксы портят всю малину.&lt;/p&gt;

&lt;p&gt;Поскольку сравнение &amp;quot;в лоб&amp;quot; не проходит, приходится искать другие, обходные пути. Например использовать для сравнения строк так называемое расстояние Левенштейна.&lt;/p&gt;

&lt;p&gt;Если не вдаваться в подробности, то этот алгоритм просто сравнивает два слова и выдает число, которое является показателем, сколько нужно сделать вставок, замен и удалений символов, чтобы из первого слова получить второе.&lt;/p&gt;

&lt;p&gt;Т.е. для организации поиска можно использовать, например, такой подход: &lt;span style=&quot;color:#FFFF00;&quot;&gt;&lt;em&gt;если расстояние Левенштейна между двумя словами меньше 2, то считаем, что слова одинаковы (совпадают по смыслу, являются однокоренными)&lt;/em&gt;&lt;/span&gt;&lt;em&gt;.&lt;/em&gt; Кстати, похоже именно этот алгоритм используется механизмом поиска в Ласто-блоге.&lt;/p&gt;

&lt;p&gt;Этот подход дает достаточно приемлемые результаты. Так например слова &amp;quot;блог&amp;quot;, &amp;quot;блога&amp;quot;, &amp;quot;блогу&amp;quot;, &amp;quot;блоге&amp;quot; получаются совпадающими. В принципе не плохо, Но (как обычно) есть и подводные камни. Причем сразу несколько.&lt;/p&gt;

&lt;ol&gt;

    &lt;li&gt;Алгоритм довольно медленный, а учитывая какую гору информации необходимо перелопатить использование его ставится под вопрос. &lt;br /&gt;

    Допустим, что на сайте сотня страниц, каждая из которых содержит примерно 1000 слов. Да еще посетитель ввел в запросе не одно слово, а сразу три. Получается, что нужно произвести 300 000 сравнений, чтобы получить полный результат. Естественно, что процесс можно оптимизировать - удалить заведомо ложные (неискомые) слова, прекращать поиск при первом совпадении, хранить словари и т.д... Но все равно, даже если придется проделать в 50 раз меньше сравнений, нагрузка получается довольно большая. И это для сайта всего из сотни страниц....&lt;/li&gt;

    &lt;li&gt;Анализ количества действий для преобразования одного слова в другое на самом деле все же довольно туп, т.к. в приведенном выше примере слово &amp;quot;блог&amp;quot; совпадет не только с реально однокоренными словами, но и со словами, совершенно никакого отношения к искомому не имеющими. Например слово &amp;quot;&lt;span style=&quot;color:#FFFF00;&quot;&gt;блоК&lt;/span&gt;&amp;quot; так же будет учтено. Соответственно результаты поиска будут захламлены нерелевантными документами, которые просто содержат слова похожие на искомые. Что собственно и наблюдается в результатах поиска по блогу.&lt;/li&gt;

&lt;/ol&gt;

&lt;p&gt;Для поисковиков такое захламление только в плюс - увидят лишние ссылки на внутренние документы. А вот посетителям врядли понравится листать десятки страниц выдачи, наблюдая практически полное отсутствие релевантности найденного искомому.&lt;/p&gt;

&lt;p&gt;Вторая крупная проблема, возникающая при создании поискового механизма для крупного сайта, состоит в неоднородности содержимого этого самого сайта. Тут тебе и магазины и форумы и блоги и новости и еще черт знает что. И каждый модуль хранит свои данные в своем собственном формате и в своих базах. Поэтому создать по настоящему универсальный поиск для большого разнородного сайта - та еще задача.&lt;/p&gt;

&lt;h2&gt;Какие же могут быть варианты решения?&lt;/h2&gt;

&lt;ol&gt;

    &lt;li&gt;Написать свой мега-умный алгоритм анализа, учитывающий специфику славянского языка, понимающий фигову кучу форматов и самостоятельно отделяющий зерна от плевел.&lt;/li&gt;

    &lt;li&gt;Использовать сторонние разработки, специально для такой работы заточенные.&lt;/li&gt;

&lt;/ol&gt;

&lt;p&gt;Собственно реально приемлемый вариант только один, т.к. врядли кому-то придет в голову идея писать нейронные сети на PHP, да и мозг можно повредить, занимаясь таким неблагодарным делом. Не говоря уж про хостера, которому очень не хочется отдавать 99% ресурсов сервера под ваш скрипт.&lt;/p&gt;

&lt;p&gt;Остается только второй вариант - использование сторонних сервисов. Благо их в достатке - все поисковые машины только для того и рождены, чтобы реализовывать этот самый поиск. И разрабатывались они не пионером-одиночкой, а целыми командами дипломированных специалистов, специально для такой работы обученных. Нам же остается только лишь придумать способ использования их ресурсов для наших целей.&lt;/p&gt;

&lt;p&gt;Тут так же есть варианты.&lt;/p&gt;

&lt;p&gt;Почти каждый из поисковиков предоставляет возможность хозяевам сайтов разместить у себя на страницах специальный код, который соорудит в броузере формочку для комфортного поиска по вашему ресурсу. Последние варианты этих поделок даже умеют интегрировать результаты работы в существующий дизайн сайта, для еще большего комфорта.&lt;/p&gt;

&lt;p&gt;К недостаткам же стоит отнести то, что такие механизмы либо платные, либо будут втихаря крутить на вашем сайте разную рекламу, либо не позволят встроиться в дизайн и будут тупо перенаправлять ищущих на свои сайты, где опять же будут крутить рекламу....&lt;/p&gt;

&lt;p&gt;К тому же даже во встроенном варианте результаты поиска будут генерироваться java-скриптом, а значит не могут являться сырьем для создания сети внутренних линков, поскольку поисковикам они будут не видны.&lt;/p&gt;

&lt;p&gt;Вот, собственно, и задача сформировалась: &lt;strong&gt;&lt;span style=&quot;color:#FFFF00;&quot;&gt;создать нечто, что будет использовать для поиска по сайту ресурсы какой-либо из поисковых машин и при этом результаты будет встраивать в страницу сайта в виде полноценных статичных и видимых всеми ссылок.&lt;/span&gt;&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Убиваем сразу четырех зайцев:&lt;/p&gt;

&lt;ol&gt;

    &lt;li&gt;не нужно ломать ум над сверх-интеллектуальным алгоритмом анализа текста&lt;/li&gt;

    &lt;li&gt;не нужно жрать ресурсы хостера на реализацию поиска по сверх-интеллектуальному алгоритму и соответственно заставлять серфера ждать, пока наш &amp;quot;мега-сыщик&amp;quot; найдет что-нить подходящее.&lt;/li&gt;

    &lt;li&gt;не нужно крутить бесплатно чужую рекламу и надеяться, что у серфера не отключена поддержка java-script в броузере.&lt;/li&gt;

    &lt;li&gt;получаем добавочную внутреннюю перелинковку, опять же дико-релевантную, которю видят поисковики.&lt;/li&gt;

&lt;/ol&gt;

&lt;h2&gt;Теперь, внимание, вопрос! А нужно ли все это?&lt;/h2&gt;

&lt;p&gt;Точнее, ставить его нужно так: &lt;u&gt;&lt;strong&gt;а много ли сайтов, построенных на ласто-блогах, реально сделаны для людей, а не для тупой продажи ссылок?&lt;/strong&gt;&lt;/u&gt;&lt;/p&gt;

&lt;p&gt;Если действительно много, тогда стоит заняться реализацией вышеописанной приблуды. Ну а если нет, то... на &amp;quot;нет&amp;quot; и суда нет.&lt;/p&gt;

&lt;p&gt;Отписывайте свои пожелания и мысли в комментах, а заодно &lt;a target=&quot;_blank&quot; href=&quot;http://fit-media.com/gs.html&quot;&gt;вот тут&lt;/a&gt; можете пронаблюдать черновичек, реализующий поиск по этому сайту с помощью гугля.&lt;/p&gt;

&lt;p&gt;%%% поиск по сайту, google, скрипт, броузер, программирование %%%&lt;/p&gt;&lt;br&gt;&lt;br&gt;Wed, 17 Jun 2009 12:52:02 GMT&lt;hr&gt;тема: &lt;b&gt;Нечто похожее&lt;/b&gt;&lt;br&gt;&lt;br&gt;Тема топика реализовано в Портаторе. Но ежели будет подобная приблуда и для блога это только плюс. &lt;br&gt; &lt;br&gt; Lex Nevermind  &lt;a href=http://fit-media.com/connect_3adb3c5572deb3c1c5b3c5b04c5fa72de4073df92f4c5934fa73adc79496b514c5.html&gt;=email=&lt;/a&gt;&lt;hr&gt;&lt;br&gt;&lt;br&gt;Wed, 17 Jun 2009 14:14:00 GMT&lt;hr&gt;тема: &lt;b&gt;Очень нужно&lt;/b&gt;&lt;br&gt;&lt;br&gt;Может для &quot;сплоговодов&quot; и &quot;саперов&quot; не очень нужно, но лично у меня именно СДЛ на скрипте блога и множество страниц. И полноценный поиск по всем страничкам в общем нужен и как собственно качественный сервис и как средство перелинковки. &lt;br&gt; &lt;br&gt; &lt;br&gt; Miki  &lt;a href=http://fit-media.com/connect_f3800db1582db9c751d6bfe205b850255f06.html&gt;=email=&lt;/a&gt;&lt;hr&gt;&lt;br&gt;&lt;br&gt;Wed, 17 Jun 2009 22:29:35 GMT&lt;hr&gt;тема: &lt;b&gt;Кстати&lt;/b&gt;&lt;br&gt;&lt;br&gt;Очень клёво было б заиметь такую штуку на нанке. Думаю, разницы особой в скрипте не будет. &lt;br&gt; &lt;br&gt; Lex Nevermind  &lt;a href=http://fit-media.com/connect_3adb3c5572deb3c1c5b3c5b04c5fa72de4073df92f4c5934fa73adc79496b514c5.html&gt;=email=&lt;/a&gt;&lt;hr&gt;&lt;br&gt;&lt;br&gt;Thu, 18 Jun 2009 00:26:46 GMT&lt;hr&gt;тема: &lt;b&gt;Комментарий автора:&lt;/b&gt;&lt;br&gt;&lt;br&gt;Совершенно не проблема. Этот скрипт не привязан к движку, поэтому его можно (немного поколдовав) прикрутить к любому сайту, хоть на Nano, хоть на ворд-пресс. В принципе, если хостер позволяет использовать на сайте PHP, то даже на HTML&#039;ьный сайт прикрутится, правда колдовать немного больше придется.&amp;nbsp;Кстати, вот тут: &lt;a target=_blank href=http://fit-media.com/ys.html&gt; http://fit-media.com/ys.html &lt;/a&gt; таже приблуда, но уже использующая Яндекс в качестве движка (он сильнее любит этот сайт) ;)&lt;hr&gt;&lt;br&gt;&lt;br&gt;&lt;a href=http://fit-media.com/comment_1245195136.html&gt;Оставить комментарий&lt;/a&gt;</description>
<pubDate>Wed, 17 Jun 2009 03:32:16 GMT</pubDate>
</item>

  </channel>
</rss>