В Гугле есть оператор daterange, который можно включать в поиск в форме daterange:xx-yy, где xx и yy юлианские числа (сегодняшнее юлианское число - 2454197, конвертер, например, http://aa.usno.navy.mil/data/docs/JulianDate.html).
Хороший вопрос. Не задумывался над ним специально. Просто исходил из того, что если сделать серч в яндексе, то внизу будут предложены две опции - сортировать по релевантности или по дате. Что конкретно они понимают под датой - не знаю, но что-то ведь понимают...
яндекс предлагает этот вариант как стандартную альтернативу сортировке по релевантности, а еще выше рекомендуют оллзевеб - http://bbb.livejournal.com/1762034.html?thread=9566450#t9566450
Дело даже не столько в дате в метаданных, которая факультативна и, насколько я понимаю, отсутствует у значительной части (едва ли не большинства) страниц, а в timestamp файла, созданном ОС, и, обычно, доступном клиентам. Т.е., время создания файла известно поисковикам, почти все они используют его, как одну из переменных в формулах рейтинга найденных документов.
Таймстемп какого файла? HTML документа? Помилуйте, сколько осталось энжинов, хранаящих статические HTML страницы?
Но вообще-то я не слышал, чтобы http запрос позволял получить осовскую дату файла. А поисковые боты, вроде, как и мы, смертные, только такими запросами и ходят.
no subject
Date: 2007-04-06 05:31 pm (UTC)no subject
Date: 2007-04-06 05:35 pm (UTC)no subject
Date: 2007-04-06 05:38 pm (UTC)no subject
Date: 2007-04-06 05:49 pm (UTC)"Самому интересно".
no subject
Date: 2007-04-06 06:39 pm (UTC)дата создания документа гуглу неизвестна, а дата индексирования гуглом неинтересна ищущим
no subject
Date: 2007-04-06 06:59 pm (UTC)no subject
Date: 2007-04-06 07:04 pm (UTC)Вот пример поиска страниц, содержащих фразу "world bank" и обновленных между 1 января и 1 ноября 2005 года:
http://www.google.com/search?q=%22world%20bank%22%20daterange:2453371-2453675
Работает это плохо.
no subject
Date: 2007-04-06 07:06 pm (UTC)Полезная фича. кстати.
Попробуйте вот http://www.faganfinder.com/google2.html
Не совсем то, но на безрыбье и рак рыба.
no subject
Date: 2007-04-06 07:10 pm (UTC)no subject
Date: 2007-04-06 07:34 pm (UTC)no subject
Date: 2007-04-06 07:44 pm (UTC)no subject
Date: 2007-04-06 07:44 pm (UTC)no subject
Date: 2007-04-06 07:46 pm (UTC)no subject
Date: 2007-04-06 08:29 pm (UTC)no subject
Date: 2007-04-06 09:28 pm (UTC)no subject
Date: 2007-04-06 11:20 pm (UTC)Но вообще-то я не слышал, чтобы http запрос позволял получить осовскую дату файла. А поисковые боты, вроде, как и мы, смертные, только такими запросами и ходят.
no subject
Date: 2007-04-08 02:15 pm (UTC)или HTML документа, или lastmod атрибут в URL для сайтов, использующих Sitemap протокол (это работает и для динамического HTML)
> Но вообще-то я не слышал, чтобы http запрос позволял получить осовскую дату файла
Позволяет. Посмотрите в IE File -> Properties. Там есть две строчки: Created и Modified. Для некэшированных файлов они покажут соответствующие даты.
no subject
Date: 2007-04-08 03:41 pm (UTC)> Посмотрите в IE File -> Properties.
Это я могу посмотреть, на своём компе и не по http. Не уверен, можно ли по HTTP протоколу без согласия хозяина сервера получить эти параметры.
В протоколе http есть вот это: http://www.google.com/support/webmasters/bin/answer.py?answer=40203
Но оно немного для другого, абсолютной даты не даёт.
no subject
Date: 2007-04-08 04:10 pm (UTC)не совсем, Sitemap делает это автоматически
> Не уверен, можно ли по HTTP протоколу без согласия хозяина сервера получить эти параметры.
в HTTP есть Last-Modified entity-header field (http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.29).
no subject
Date: 2007-04-08 04:11 pm (UTC)no subject
Date: 2007-04-08 05:51 pm (UTC)Вежливые cmsки эту дату шлют в заголовках сознательно.