Полнотекстовые книги онлайн
May. 9th, 2009 03:59 pmВсе-таки революция совершается прямо на наших глазах. Например, ютуб уже, наверно, назад в кувшин не затолкать - то есть создана универсальная система бесплатного и мгновенного доступа к музыкальным клипам. Конечно, их качество остается намного меньше полноценного сидишного, но это ничего: те, кто не готов потратить деньги ради продукта максимально высокого качества, не отсекаются от доступа к музыке вообще.
То же и с книгами. pdf и djvu - замена настоящей книги для того, у кого нет времени, денег, места в доме и т.д. для приобретения профессионально напечатанного и переплетенного издания.
В рамках этой общей революции произошел совершенно неожиданный переворот в смысле доступности старых книг. Если еще вчера-позавчера книга, изданная в последние, скажем, сорок лет была еще более или менее доступна широкому читателю (магазин, массовая библиотека), то с изданиями столетней давности было намного сложнее - они хранились только в крупнейших библиотеках, часто с ограниченным доступом читателей. Теперь, в результате гигантского проекта гугля, буквально миллионы изданий до 1922 года выложены онлайн, в том числе многие тысячи книг и журналов на русском языке. Вот год назад я случайно обнаружил сборники РИО, а это только малая часть выложенного.
Параллельно идет массовый и децентрализованный процесс оцифровывания книг индивидуальными энтузиастами, многие из которых размещаются на крайне неудобных коммерческих сайтах типа rapidshare.com или распространяются по файлообменным системам типа torrents.ru
И там, и там имеются проблемы. Доступ к оцифрованным книгам гугля, похоже, сильно ограничен территориально - вне США он оказывается намного меньшим, чем в США. Хранение книг на коммерческих файлохранилищах, как я понимаю, ограничено по срокам и трудностью рубрикации и поиска.
Поэтому мне кажется особо перспективным проект Text Archive - http://www.archive.org/details/texts
Там любой может зарегистрировать аккаунт и выкладывать тексты изданий. Можно это делать целыми коллекциями. Например, кто-то выложил т.н. "André Savine Collection" - коллекцию белогвардейских и власовских изданий, хранящуюся в библиотеке университета Северной Каролины в Чепел Хилл (http://www.archive.org/search.php?query=collection%3A%22savmil%22). А какой-то юзер tpb подряд копирует туда все (все ли?) книги, выложенные в рамках проекта гугля. Не имею представления, что это за юзер такой - живой человек, группа людей или просто робот. В частности, благодаря этому не то человеку, не то учреждению, не то роботу туда попали все те же тома РИО.
Среди выложенных книг имеются и изданные относительно недавно - скажем, имеются академические издания 60-х и 70-х годов.
Я в виде эксперимента зарегистрировал там аккаунт и выложил несколько публикаций. Похоже, делается это очень легко. Если выкладывать djvu-файлы, то они так и остаются, больше ничего к ним не добавляется, а если выкладывать pdf-файлы, то они, помимо того, что оказываются доступными для читателя, попадают и в какие-то внутренние шестеренки проекта, в результате чего параллельно с ними генерируются - 1) djvu-версии той же публикации, 2) текстовая расшифровка и 3) "Flip Book", то есть опция чтения книги с экрана с виртуальным перелистыванием страниц по одной или сразу по многу. Опять же, не уловил, кто это делает - робот ли или какие-нибудь живые энтузиасты. Эксперимент показал, что расшифровка английского текста там достаточно эффективна, русский текст превращается в абракадабру и пользоваться им бессмысленно, а флип-книги из моих файлов почему-то не получились - линки есть, а книгу не видно.
Система не дает возможности полнотекстового поиска, имеющегося в гугле, а ограничивает его названием, автором и ключевыми словами. Ключевые слова проставляет владелец аккаунта, поэтому надо не жалеть и расставлять их побольше и поаккуратнее.
Заметил еще, что система плохо распознает языки. Русские тексты она атрибутирует то как чешские, то как словенские, так что через некоторое время приходится исправлять этот параметр вручную.
Как мне показалось, в среде русских пользователей этот ресурс используется совершенно недостаточно. Думаю, что тем, кто самолично занимаются полезным делом оцифровки книг и журналов, следует как минимум дублировать свои выкладывания на этот ресурс (если, конечно, они не озабочены генерированием трафика на свои собственные сайты) - для надежности, удобства и т.д. В первую очередь это относится к тем, кто оцифровывает издания относительно редкие - старинные, специализированные, выпущенные некоммерческими, немассовыми, академическими и т.д. издательствами, отсутствующие в текущей продаже, адресованные сравнительно узкому кругу читателей. Выкладывание таких изданий связано, судя по всему, с меньшими шансами конфликта по поводу т.н. "копирайта".
То же и с книгами. pdf и djvu - замена настоящей книги для того, у кого нет времени, денег, места в доме и т.д. для приобретения профессионально напечатанного и переплетенного издания.
В рамках этой общей революции произошел совершенно неожиданный переворот в смысле доступности старых книг. Если еще вчера-позавчера книга, изданная в последние, скажем, сорок лет была еще более или менее доступна широкому читателю (магазин, массовая библиотека), то с изданиями столетней давности было намного сложнее - они хранились только в крупнейших библиотеках, часто с ограниченным доступом читателей. Теперь, в результате гигантского проекта гугля, буквально миллионы изданий до 1922 года выложены онлайн, в том числе многие тысячи книг и журналов на русском языке. Вот год назад я случайно обнаружил сборники РИО, а это только малая часть выложенного.
Параллельно идет массовый и децентрализованный процесс оцифровывания книг индивидуальными энтузиастами, многие из которых размещаются на крайне неудобных коммерческих сайтах типа rapidshare.com или распространяются по файлообменным системам типа torrents.ru
И там, и там имеются проблемы. Доступ к оцифрованным книгам гугля, похоже, сильно ограничен территориально - вне США он оказывается намного меньшим, чем в США. Хранение книг на коммерческих файлохранилищах, как я понимаю, ограничено по срокам и трудностью рубрикации и поиска.
Поэтому мне кажется особо перспективным проект Text Archive - http://www.archive.org/details/texts
Там любой может зарегистрировать аккаунт и выкладывать тексты изданий. Можно это делать целыми коллекциями. Например, кто-то выложил т.н. "André Savine Collection" - коллекцию белогвардейских и власовских изданий, хранящуюся в библиотеке университета Северной Каролины в Чепел Хилл (http://www.archive.org/search.php?query=collection%3A%22savmil%22). А какой-то юзер tpb подряд копирует туда все (все ли?) книги, выложенные в рамках проекта гугля. Не имею представления, что это за юзер такой - живой человек, группа людей или просто робот. В частности, благодаря этому не то человеку, не то учреждению, не то роботу туда попали все те же тома РИО.
Среди выложенных книг имеются и изданные относительно недавно - скажем, имеются академические издания 60-х и 70-х годов.
Я в виде эксперимента зарегистрировал там аккаунт и выложил несколько публикаций. Похоже, делается это очень легко. Если выкладывать djvu-файлы, то они так и остаются, больше ничего к ним не добавляется, а если выкладывать pdf-файлы, то они, помимо того, что оказываются доступными для читателя, попадают и в какие-то внутренние шестеренки проекта, в результате чего параллельно с ними генерируются - 1) djvu-версии той же публикации, 2) текстовая расшифровка и 3) "Flip Book", то есть опция чтения книги с экрана с виртуальным перелистыванием страниц по одной или сразу по многу. Опять же, не уловил, кто это делает - робот ли или какие-нибудь живые энтузиасты. Эксперимент показал, что расшифровка английского текста там достаточно эффективна, русский текст превращается в абракадабру и пользоваться им бессмысленно, а флип-книги из моих файлов почему-то не получились - линки есть, а книгу не видно.
Система не дает возможности полнотекстового поиска, имеющегося в гугле, а ограничивает его названием, автором и ключевыми словами. Ключевые слова проставляет владелец аккаунта, поэтому надо не жалеть и расставлять их побольше и поаккуратнее.
Заметил еще, что система плохо распознает языки. Русские тексты она атрибутирует то как чешские, то как словенские, так что через некоторое время приходится исправлять этот параметр вручную.
Как мне показалось, в среде русских пользователей этот ресурс используется совершенно недостаточно. Думаю, что тем, кто самолично занимаются полезным делом оцифровки книг и журналов, следует как минимум дублировать свои выкладывания на этот ресурс (если, конечно, они не озабочены генерированием трафика на свои собственные сайты) - для надежности, удобства и т.д. В первую очередь это относится к тем, кто оцифровывает издания относительно редкие - старинные, специализированные, выпущенные некоммерческими, немассовыми, академическими и т.д. издательствами, отсутствующие в текущей продаже, адресованные сравнительно узкому кругу читателей. Выкладывание таких изданий связано, судя по всему, с меньшими шансами конфликта по поводу т.н. "копирайта".
no subject
Date: 2009-05-09 08:12 pm (UTC)no subject
Date: 2009-05-09 08:25 pm (UTC)no subject
Date: 2009-05-09 08:28 pm (UTC)no subject
Date: 2009-05-09 08:31 pm (UTC)))))
no subject
Date: 2009-05-09 08:33 pm (UTC)Книги, видимо, не все с гуглбукс "транслируются". Например, вот этой не нашел
http://books.google.com/books?id=u3BAAAAAIAAJ&pgis=1
а она давно на гуглбукс лежит. Или скажем сборников постановлений сената Великого княжества Финляндского вроде бы нет.
no subject
Date: 2009-05-09 08:36 pm (UTC)Нет, не лежит. Точнее, она не выложена в категории "full view", о которой только и идет речь.
no subject
Date: 2009-05-09 08:39 pm (UTC)no subject
Date: 2009-05-09 08:46 pm (UTC)no subject
Date: 2009-05-09 08:48 pm (UTC)no subject
Date: 2009-05-09 09:34 pm (UTC)no subject
Date: 2009-05-10 12:24 am (UTC)no subject
Date: 2009-05-10 11:22 am (UTC)а вот с ютубом борьба идет достаточно успешно, половину моих фейворитсов запилили.
no subject
Date: 2009-05-10 11:45 am (UTC)no subject
Date: 2009-05-10 12:44 pm (UTC)no subject
Date: 2009-05-10 01:07 pm (UTC)no subject
Date: 2009-05-10 07:22 pm (UTC)no subject
Date: 2009-05-10 08:32 pm (UTC)Там пока еще идет процесс переваривания, поэтому, в частности, внесенные мной вручную поправки (скажем, замена ошибочно проставленного чешского языка на русский) могут быть еще не видны. То же самое относится к djvu-версии, которая появится, вероятно, через день или два.
no subject
Date: 2009-05-11 01:39 am (UTC)no subject
Date: 2009-05-11 01:47 am (UTC)no subject
Date: 2009-05-11 07:12 am (UTC)перетасканные на рапиду русские книжки с гбукс см на:
www.archeologia.ru/modules/forum/viewtopic.php?t=2142
регулярно пополняется
no subject
Date: 2009-05-11 12:29 pm (UTC)Кстати видеоклипы на Ю-тюбе иногда исчеза
no subject
Date: 2009-05-11 12:31 pm (UTC)no subject
Date: 2009-05-11 12:43 pm (UTC)www.archeologia.ru/modules/forum/viewtopic.php?t=2142
регулярно пополняется
Так о том и речь, что они же давно уже лежат на архиве.орг, с более удобным и быстрым доступом, сразу в нескольких форматах (как минимум pdf и djvu, причем pdf часто в двух вариантах, цветной и черно-белый). И не надо мучений с рапидшарой.
no subject
Date: 2009-05-11 01:39 pm (UTC)no subject
Date: 2009-05-11 02:18 pm (UTC)no subject
Date: 2009-05-12 01:15 am (UTC)no subject
Date: 2009-05-12 01:19 am (UTC)http://www.npr.org/blogs/library/2009/04/the_granting_of_patent_7508978.html?sc=fb&cc=fp
no subject
Date: 2009-05-12 01:33 am (UTC)no subject
Date: 2009-05-12 01:36 am (UTC)no subject
Date: 2009-05-12 01:36 am (UTC)no subject
Date: 2009-05-12 02:12 am (UTC)Цифра неточная, конечно, но проблема существует.
Хотя... если сравнить издержки на покупку и содержание Ютюба с состоянием владельцев гугла, то получается по пропорции примерно так же, как среднему американцу купить себе широкоэкранный телевизор и подписку на кабель.
:Так же не могу судить, насколько убедительно мнение, что, дескать, рекламу вставлять нельзя, так как нет согласия тех, кто загружает ролики (http://www.webtvwire.com/youtube-money-making-machine-or-financial-black-hole-the-debate-rages-on).
Тут же важен не сам факт наличия рекламы, а контекст. Не всякому рекламодателю хочется, чтобы его продукт ассоциировался с хомяком, падающем с пианино. С другой стороны, у рекламы в роликах очень плохая отбивка. Народу хочется клип смотреть, а не рекламу. Вместе получаем финансовый
:Неужели так сложно добавить к форме для заливки роликов маленькую кнопочку, означающую согласие на рекламу?
Технически - не сложно, а с юридической, думаю, нетривиально. Любой код, прикасающийся к деньгам, сразу попадает под столько законов и предписаний, что волосы дыбом встают. Плюс, более-менее безобидное пиратство, за которое только и скажут "безобразие! Надо убрать!" сразу превращается с пиратство с целью извлечения прибыли.
no subject
Date: 2009-05-12 02:15 am (UTC)Посмотрим, чем Google v. Viacom закончится. У дела есть все шансы дойти до Верховного Суда.
no subject
Date: 2009-05-12 02:22 am (UTC)no subject
Date: 2009-05-12 02:33 am (UTC)no subject
Date: 2009-05-18 09:31 pm (UTC)no subject
Date: 2009-05-18 09:35 pm (UTC)no subject
Date: 2009-05-18 09:38 pm (UTC)no subject
Date: 2009-05-18 09:53 pm (UTC)Но, возможно, я и ошибся.
no subject
Date: 2009-05-18 10:48 pm (UTC)I agree that it’s a very pleasant, mainstream scent that could please a wide variety of folks.
Date: 2011-04-22 07:13 pm (UTC)Digest presents in-depth and quality research and resources on the UFO phenomenon.
[URL=http://www.mathcom.gr/fotos/icons/bally-wallet-in-canada.html]Bally wallet in Canada[/URL]
[URL=http://www.mathcom.gr/fotos/icons/gucci-replica-bag-china1.html]Gucci replica bag China[/URL]
[URL=http://www.mathcom.gr/fotos/icons/prices-for-chanel-handbags.html]Prices for chanel handbags[/URL]
[URL=http://www.mathcom.gr/fotos/icons/miu-miu-shoes-.html]Miu miu shoes [/URL]
[URL=http://www.mathcom.gr/fotos/icons/replica-handbags-in-toronto-canada-.html]Replica handbags in toronto canada [/URL]
Gucci handbags with long straps which really look cheek and trendy.
Suffering from acne is tough to deal with and finding a way to naturally cure acne can be hard to find.
First thoughts of anger points may result in photos of a couple fighting, a guardian abusing a toddler, a young person lashing out at a instructor or a parent.
Dona??t wear your heart in your sleeves; carry it on your pocket.
There isna??t something especially fascinating about this bag however.
All of the luxury goods I have listed (to include future listings) have been purchased from Neiman Marcus, Saks Fifth Avenue, Barneys New York or from a luxury boutique.
Kimora Simmons, Baby Phat, is the perfect mix of fashion and the streets.
[URL=http://www.mathcom.gr/fotos/icons/louis-vuitton-replica-wallets1.html]Louis vuitton replica wallets[/URL]
[URL=http://www.mathcom.gr/fotos/icons/replica-birkin-hermes-handbag.html]Replica birkin hermes handbag[/URL]
New World Order conspiracism was limited to two American countercultures, primarily the militantly a
Date: 2011-04-23 02:46 am (UTC)Replica handbags are becoming increasing popular, thanks to the fashion industry.
[URL=http://footstar.gr/images/teamlogos/center/clothes-online-buy.html]Clothes online buy[/URL]
[URL=http://footstar.gr/images/teamlogos/center/buy-prada-hobo1.html]Buy Prada hobo[/URL]
[URL=http://footstar.gr/images/teamlogos/center/buy-marc-jacobs-messenger-bag.html]Buy marc jacobs messenger bag[/URL]
[URL=http://footstar.gr/images/teamlogos/center/hermes-birkin-m-bag-in-uk.html]Hermes birkin m bag in uk[/URL]
[URL=http://footstar.gr/images/teamlogos/center/buy-coach-shoulder-bag1.html]Buy coach shoulder bag[/URL]
Jones watches successfully beat out the brand at that time.
The holiday season fake hand bags tend to be deluxe kinds of handbags and this can be accessible in quite a few cool and trendy in addition to adaptable styles like Cartier look-alike bags, Mont Blanc duplicate luggage, Trainer Carriers, Hermes totes, Louis Vuitton baggage, 03 Jacob black duplicate luggage and many others.
This website aims to raise awareness about the UFO phenomenon, and to show the extent of serious, quality and scientific information and evidence available on the subject.
Nevada in the western United States, 83 miles (133 km) north-northwest of downtown Las Vegas.
Women love to be able to sit from time to time and be pampered.
German farmera??s omelette also used vinegary flavors to good effect a?? it was composed of eggs folded around chopped cornichon pickles, potatoes, and onion with just a dusting of herbs.
While a low price may be an obvious indication of a ke handbagi?? you can not depend on price to help you spot the real deal! Sellers have to point out that it is genuine leather because some of the kes are not.
[URL=http://footstar.gr/images/teamlogos/center/online-shop-givenchy-handbags.html]Online Shop Givenchy Handbags[/URL]
[URL=http://footstar.gr/images/teamlogos/center/chanel-handbag-price-.html]Chanel handbag price [/URL]