вторник, 1 февраля 2011 г.

Пост о круговороте контента в природе Интернета

в рот мне ноги

Если дракон начнёт жрать свой хвост, он подавится? Или сожрёт себя без остатка?

Вот меня сейчас заинтересовал вопрос. Поясню. В интернете существуют достаточно крупные компании, которые аккумулируют огромное количество информации. Про них все слышали, про них все знают: это Google, Яндекс, Yahoo, Facebook, Twitter и т.д. И вот допустим решит поглотить Google все петабайты серверов, допустим, Яндекса. То есть будет индексировать информацию, которая хранится в дата-центре русскоязычного поисковика. Но и Яндекс, не будь дурак, не воздухом одним питается - будет тянуть инфу с серверов Гугла.

Получается масло масляное, воду в ступе толочь и то толк будет.

Но что я наблюдаю, товарищи мои, создавать контент дело трудное и долгое, а индексировать по тихому мы все умеем. И технология RSS вообще кстати пришлась. С фидом можно делать что угодно: хочешь добавлять в Facebook, посылай в RSS-каталоги, изменяй в YahooPipes и т.д. и т.п.

Информация дробится, растаскивается на кусочки. Энтропия, етить его налево. Порой трудно установить первоисточник того, например, кто сказал "бля!", как этот возглас растиражировался  по порталам и лентам. Кто-то добавит своё, кто-то отлично умеет синонимизировать. Но первоисточник затерялся в этой неразберихе.

Аккуратно парсю картинки с Яндекса по определенным запросам. Тут же их вставляю в сплог и Яндекс хавает их, кривится, но хавает.  А посмотрите как хорошо сидит в индексе сплог нагенеренный цепями Маркова из статей про Форекс.


сплог
Это сплог web-golds.blogspot.com

Профессиональные дорвейщики давно научились кормить дракона его же собственным хвостом. Но я дорвеями не занимаюсь. А это показал результат одного моего эксперимента.
Трафик на таком доре есть -  около 20 уников в месяц.


А суть эксперимента сводилась к тому, что я брал сохраненный кеш сайтов, чьё доменное имя не стали продлевать. То есть срок регистрации сайта закончился и он ушел в небытие. Но какая-то память о нём остаётся в виде проиндексированных страничек. Вот я их доставал эти страницы и использовал по новой.

Помните обо мне

И это я показал один из примеров, когда под распространенной фразой "добыча контента" вебмастер привлекает к своей персоне внимание, поисковика ли иль другого поедателя контента, используя еду с "чужого стола".

И это пока не рассказывал про RSS... Есть вопросы?

Фриман.Следующая серия.

2 коммент. :

Блог - очень ог. комментирует...

wow
не знал про сей способ.

Блог - очень ог. комментирует...

Откуда берёшь списки этих непродлённых блогов?

Отправить комментарий

Есть мнение, отзыв или предложение - пиши сюда!

Обязательно прочти новые посты блога