Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
konst1 RE:Подайте бедному копеечку на книжку с литреса... 23 часа
sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 4 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 недели larin RE:Пропал абонемент 3 недели Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 месяц sem14 RE:Серия "Символы времени" издательства "Аграф" 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц tvv RE:faq brainstorm =) 1 месяц Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 месяц Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 5 дней larin RE:абонемент не обновлен 1 месяц sem14 RE:За иллюминатором (серия) - чего не хватает? 1 месяц sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 1 месяц Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 1 месяц tvv RE:DNS 2 месяца MrMansur RE:<НРЗБ> 2 месяца Stager RE:Беженцы с Флибусты 2 месяца Впечатления о книгах
Isais про Голотвина: Домашний учитель для чудовища [СИ] (Боевая фантастика, Социальная фантастика, Самиздат, сетевая литература)
08 03 «Домашний учитель для чудовища» — то же, что и «Педагогическая баллада» этих же авторов, сюжет и фабула совпадают. Но за счет добавления деталей, их переакцентировки, более прописанного социального фона именно этот вариант ……… Оценка: хорошо
Barbud про Смолин: Ван Ван из Чайны 4 (Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
08 03 Первые три части были более-менее читабельны, на четвертой я сломался. Смрадным потоком попёрло политиканство, рассуждения о патриотизме, охаивание тех, кто не разделяет идеи этого самого китайского патриотизма и т.д. Читать дальше не вижу смысла. Оценка: нечитаемо
Isais про Аренев: Порох из драконьих костей (Детская фантастика, Городское фэнтези, Самиздат, сетевая литература)
08 03 Просто поражает, как в 2015-м году писатель точно, хоть и метафорично, но в деталях описал весь бытовой уклад, который сложился в России 2024-2026 гг., многое, что происходит в сегодняшней России и что, по прогнозам, еще будет ……… Оценка: хорошо
udrees про Володин: Газлайтер. Том 8 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
08 03 Продолжение бандитской жизни в бандитской стране – какой-то России будущего, где всеми заправляют феодалы-дворяне в стране. Любые проблемы решают чисто по-гангстерски, Чикаго 30-х годов отдыхает, и 90-е годы в России тоже. ……… Оценка: неплохо
udrees про Володин: Похождения египетского бога в типично фэнтезийном мире [СИ] (Фэнтези, Эротика, Самиздат, сетевая литература)
08 03 Порнографический опус, ценности почти никакой, написано примитивно, все разговоры такие же простые, практически на каждой странице описания сцен секса, в том числе извращенных, все женщины любят анальный секс и минет, вот ……… Оценка: плохо
udrees про Некрасов: Cut Shot 18+ [СИ] (Эротика, Юмор: прочее, Самиздат, сетевая литература)
08 03 Порнографический высер озабоченного подростка. Никакого сюжета, описаний мало-мальски серьезных, разумных разговоров – просто безостановочный трах на каждой странице, по любому поводу, с любой особой женского пола, в любую ……… Оценка: плохо
udrees про Вальтер: Браконьер 1 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
08 03 Параллельная книга-история по вселенной Жажды, про войну вампиров и людей. Еще одна история выживальщика в новом мире, начиная с самого начала катастрофы. Описания хорошие, даром что герой не супермен, а обычный автослесарь, ……… Оценка: хорошо
mysevra про Шацкая: Настольная книга стервы (Психология)
06 03 О, это нечто, товарищи. Хотя я лично знакома с барышней неопределенного возраста, для которой эта книга, а ещё «Как влюбить в себя любого» Лаундес и биография принцессы Дианы являются действительно настольными, и всё у неё ……… Оценка: неплохо
mysevra про Лондон: Время-не-ждет [= День пламенеет] [Burning Daylight ru] (Приключения: прочее, Классическая проза ХX века)
06 03 У этого автора все работы замечательные, но некоторые особо выделяются на общем фоне. Эта книга – одна из таких, её не забудешь и ни с чем не спутаешь. Оценка: отлично!
mysevra про Эстес: Бегущая с волками. Женский архетип в мифах и сказаниях [Women Who Run with the Wolves. Myths and Stories of the Wild Woman Archetype ru] (Мифы. Легенды. Эпос, Психология, Самосовершенствование)
06 03 Кто-то очень метко высказался: «Женская энергия – это не про соответствие каким-то шаблонам. Не про жертвенность, не про покорность и уж точно не про вечную улыбку. Это про способность быть мягкой без слабости, гибкой без ……… Оценка: отлично!
Chernovol про Ефимович: Майя Плисецкая (Биографии и Мемуары)
05 03 Хорошая книга, но ни одной иллюстрации-фотографии. Оценка: хорошо
nightrunner про Пехов: Птицелов (Фэнтези, Самиздат, сетевая литература)
03 03 Хуже предыдущей. Опять поди с бабой своей писал Оценка: неплохо |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы