Результаты (
русский) 2:
[копия]Скопировано!
Беда в текст шахтных
Компьютеры могут быстро сканировать тысячи научных работ, чтобы сделать полезные связи, но работа тормозится по неловкости издателей. Ричард Ван Noorden 7 марта 2012 Исправлено: 08 марта 2012 Статья инструменты PDFRights & разрешений Когда он был увлеченным Молодой студент биологии выпускник в 2006 году, Макс Haeussler написал компьютерную программу, которая будет сканировать, или "обход", простой текст и вытащить любой последовательности ДНК. Чтобы проверить свое изобретение, наивный текст шахтер загруженный около 20000 научных работ, что его учреждение заплатили доступа -. И оперативно найти его IP-адрес заблокирован издатель газетах "Он не был до 2009 года, что Haeussler, то в университете Манчестера , Великобритания, и в настоящее время в университете Калифорнии, Санта-Крус, вернулась к проекту всерьез. Он пришел к выводу, что стандартные лицензии сайт не разрешает систематические загрузки, потому что издатели опасаются, оптовая кражи их содержание. Так Haeussler начал задавать условия лицензирования ползать и текст-шахтное статьи. Его целью было служить науке: его программа является ключевой частью проекта text2genome, которая направлена на использование ДНК-последовательности, в научно-исследовательских работ, чтобы связать публикации в интернет-записи человеческого генома. Это может привести аннотированный геном карту, связанную с миллионами научных статей, так что биологи Сейчас геномной регион может сразу перейти на любых соответствующих документов. Но Haeussler и его text2genome коллега Кейси Бергман, А genomicist в университете Манчестера, провел более чем два года, пытаясь согласовать условия с издателями - и часто игнорируются или отпор. "Мы узнали, что это долго, трудно дорога с каждым журнале", говорит Бергман. Похожие рассказы Исследователи направленные на график интеллектуальные тенденции в Arxiv разработчиков призыв к пригодится вспомогательной лаборатории добычи литературы: скорость чтения Более родственные рассказы Многие издатели говорят, что они позволят их абонентам текст-шахту, предмет контракта и намерения текстовых шахтеров, и указывают на ряд успешных соглашений. Но, как и многих ранних поборников технологии, Haeussler и Бергман жалуются, что издатели не в состоянии справиться с запросами, и так держит ход исследования. Более того, они указывают, что текст добыча расширяется, это будет непрактично для отдельных академических команды провести лет каждый, работающих двусторонние соглашения с каждым издателем. С его разочарование кипит, Haeussler прошлой неделе начал проект по электронной почте все основные науки издатели для получения разрешения на добычу их содержание. Он будет регистрировать их ответы в Интернете (на http://text.soe.ucsc.edu) в надежде повышения осведомленности о проблеме. Академия гудит с волнением за текстовом добычи. Благодаря растущей мощности компьютера, программное обеспечение может признать, экстракт и указательный научную информацию из огромного количества обычного текста, что позволяет компьютерам читать и организовать совокупность знаний, что расширяется слишком быстро для любого человека, чтобы не отставать. "Семантическая программа" начинает записывать отношения между научными 'лица' -., Например, между конкретного препарата и специфического фермента "Когда мы лицензирована и заплатил за полный текст, мы чувствуем, что мы также должны иметь право на помоему это. "Для фармацевтических фирм, текст-добыча" первой необходимости ", что способствует развитию лекарственной, говорит Рауль Родригес Эстебан, вычислительная биолог гиганта наркотиков Boehringer Ingelheim в Риджфилд, штат Коннектикут. Компании обычно создавать собственные базы данных белков, лекарственных препаратов, клеточных типов и взаимодействий между ними, все, почерпнутые из текстового добычи, объясняет он. Технология все еще нуждается в человеческой надзор, но большинство энтузиастов ожидать текст добыча, ключ к новому виду научного открытия, основанного на богатых, машиночитаемые представления знаний собраны из обычных текстовых научных статей. Но, как обнаружил Haeussler, существует большая контрольно-пропускной пункт. Свободно доступные патенты и статья тезисы являются открытыми для текстового добычи, но материалы за платный доступ не является - даже тогда, когда учреждения заплатили за лицензию сайте. "Лицензия ориентирована позволяя человека, чтобы загрузить и прочитать статью, но не текст-шахтное его," говорит Джон Макнот, заместитель директора Национального центра Text Mining в университете Манчестера. Даже свободно доступные документы не могут прийти с разрешительных лицензий: из 2,4 млн рефератов, перечисленных PubMedCentral, только 400000 (17%) имеют лицензию для текстового добычи. Незаконный поисковые программисты могут обойти системы обнаружения издателей, например, гарантируя, что документов не пополз или скачать в одном пакете. Это нарушает нормальные условия лицензионного участка, но Haeussler говорит, что документы, полученные от такой технически незаконной текста добыче были опубликованы в ведущих журналах. Желающим текст-шахтное в рамках правил должны согласиться контракты с издателями, а иногда и заплатить взнос. Haeussler получил разрешение на добычу свод Амстердам на основе издателя Elsevier бесплатно. Но другой учебный проект текста добыча, BioNOT, на базе Университета Висконсин-Милуоки, не так повезло. Еще в 2008 году, сотрудничество было платить дополнительно за своего контракта для поиска Elsevier документы для автоматического извлечения отрицательные результаты, потенциально полезные для показа, что гены не связаны с заболеванием, например. Даже мощные лекарственные фирмы находят переговоры бремя. "Когда мы лицензирована и заплатил за полный текст, мы чувствуем, что мы также должны иметь право на добычу его," говорит Хеннинг Нильсен, руководитель библиотечно-информационного центра в Дании фармацевтической фирмы Ново Нордиск в Bagsværd, Дании, и Президент документации кольцо Pharma (ПДР), объединение информационных менеджеров, охватывающих 21 крупнейших мировых фармацевтических фирм. ИСТОЧНИК: КНР Развернуть Издатели сделку с текстом добычи запросов в различных способов. В прошлом году исследовательский консорциум издания (КНР), торговый орган, который поддерживает исследования по научной коммуникации, провел опрос о содержании добыче, для которых он опрашивается 190 журнальных издателей (E. Smit и М. ван дер Graaf учиться. Изд. 25, 35-46; 2012). Из них, 48% сказали, что они обнаружены незаконной сканирование и загрузку их содержания, и 51% получили запросы от отдельных научно-исследовательских проектов - хотя большинство получили менее пяти запросов в год (см 'Mine все мои "). Более половины издателей сказал, что они решили от случая к случаю, разрешить ли доступ. Из них одна треть сказала, что они будут взимать за это, если запрос был для коммерческих целей. Например, некоторые издатели, кажется, обеспокоены тем, что если кто-то текстовые шахты их содержание, чтобы произвести товарной продукции, то это может конкурировать или заменить их собственное содержание. Природа Издательская группа в Лондоне, который публикует этот журнал, говорит, что это не взимает существующих абонентов добывать содержания, к которым они уже имеют доступ, предмет контракта. Есть признаки того, что политика может быть только осветленные. Нильсен говорит, что НДР надеется выработать решение с крупными издателями в этом году, чтобы фармацевтические компании к тексту-мину литература легче. И в августе прошлого года, правительство Великобритании приняло рекомендации в обзоре интеллектуальной собственности, сказал, что ученые должны иметь возможность добывать текста и данных из журнальных статей, не спрашивая разрешения от владельца авторских прав - хотя это не стало законом, и не козырные текущие лицензионные соглашения, которые, как правило, чтобы запретить систематическое загрузки документов. 8 марта, об авторском праве оформление центра - организация, основанная в Danvers, штат Массачусетс, который работает с издателями по лицензированию прав - держит форум в Амстердаме, чтобы обсудить, какие издатели должны делать текстовом добычи. И Международная ассоциация научно-технической и медицинской литературы, в торговой организации, основанной в Оксфорде, Великобритания, говорит, что это работает, чтобы согласовать общую позицию по тексту и анализа данных, которые он ожидает решения к лету. Все чаще, издатели начинают признать возможности текстового добычи, и добывать свой собственный контент. Опрос КНР обнаружили, что почти половина издателей сказал, что они уже делают так, почти треть остального планирует начать в этом году. Работа - часто по контракту с тех же сторонних текст добычи фирм, которые используются в фармацевтической промышленности - как правило, включает в себя компьютерные программы, выбирая все химические вещества, гены или белки из исследовательской работе, и в некоторых случаях их загрузки на сайте базами данных. Ограниченный доступ Elsevier сейчас активно приглашать текстовые шахтеров, в том числе BioNOT, чтобы писать программы (или «приложения»), что пролезть в полном тексте его научных статей, чтобы забрать информацию. Подписчики на сайт Elsevier может получить доступ к более чем 100 из этих приложений - в том числе программы по Haeussler. Но приложения работать только в веб-сайте, и контракты, как правило, предусматривают, что добывается содержание не может быть использована в других местах. Это говорит Bergman, имеет ограниченное применение, так как издатель покрывает только небольшое количество научной литературы. Он и другие содрогаются при мысли отдельных издателей делает текстовые шахтеры используют различные стандарты, или предусматривается, что конкретная программа текст добыча может быть использован только на их работах -. Эффективно уничтожая потенциал технологии, чтобы ползать по всей исследовательской литературе Издатели по-прежнему работает, как воспользоваться текстовым добычи, но никто не хочет упустить потенциальную коммерческую ценность. "Технология развивается настолько быстро, что издатели не было времени, чтобы все обдумать", говорит Дэвид Хаусслер из Университета Калифорнии, Санта-Крус, который ведет проект text2genome. "Как только они это сделают, они будут понимать, что это прекрасная возможность." Природа 483, 134-135 (08 марта 2012 года) DOI: 10.1038 / 483134a
переводится, пожалуйста, подождите..