<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>JavaScript</title>
	<atom:link href="https://besfamilnij.ru/tag/javascript/feed/" rel="self" type="application/rss+xml" />
	<link>https://besfamilnij.ru</link>
	<description></description>
	<lastBuildDate>Sat, 07 Oct 2017 11:58:03 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://besfamilnij.ru/wp-content/uploads/2017/09/ico3-150x150.png</url>
	<title>JavaScript</title>
	<link>https://besfamilnij.ru</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Удаление пустых страниц из документов pdf с помощью JS Adobe Acrobat Pro</title>
		<link>https://besfamilnij.ru/__trashed-2/</link>
					<comments>https://besfamilnij.ru/__trashed-2/#respond</comments>
		
		<dc:creator><![CDATA[besfamilnij]]></dc:creator>
		<pubDate>Sat, 07 Oct 2017 09:56:03 +0000</pubDate>
				<category><![CDATA[Инструкции]]></category>
		<category><![CDATA[Adobe Acrobat Pro]]></category>
		<category><![CDATA[JavaScript]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[Конвертирование]]></category>
		<category><![CDATA[Мастер операций]]></category>
		<guid isPermaLink="false">https://besfamilnij.ru/?p=5249</guid>

					<description><![CDATA[<p>Не так давно передо мной стояла задача удалить из 3000 отсканированных договоров пустые страницы и страницы приложений. Плюс к этому, документ pdf должен был поддерживать поиск по тексту, а значит формат такого документа должен был быть pdf/a. Вручную распознавание, удаление и сохранение файлов заняло бы слишком много времени, поэтому была необходимость найти редактор PDF с...</p>
Запись <a href="https://besfamilnij.ru/__trashed-2/">Удаление пустых страниц из документов pdf с помощью JS Adobe Acrobat Pro</a> впервые опубликована на сайте <a href="https://besfamilnij.ru">BESFAMILNIJ</a>.]]></description>
										<content:encoded><![CDATA[<p>Не так давно передо мной стояла задача удалить из 3000 отсканированных договоров пустые страницы и страницы приложений. Плюс к этому, документ pdf должен был поддерживать поиск по тексту, а значит формат такого документа должен был быть <a href="https://ru.wikipedia.org/wiki/PDF/A" target="_blank" rel="noopener">pdf/a</a>. Вручную распознавание, удаление и сохранение файлов заняло бы слишком много времени, поэтому была необходимость найти редактор PDF с возможностью записи макросов или чем то подобным. Таким редактором оказался Adobe Acrobat Pro, он поддерживает JavaScript и умеет пакетно обрабатывать файлы.</p>
<p><img fetchpriority="high" decoding="async" class="aligncenter wp-image-5289 size-full" src="https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1.jpg" alt="" width="1366" height="736" srcset="https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1.jpg 1366w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1-150x81.jpg 150w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1-300x162.jpg 300w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1-768x414.jpg 768w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro1-1024x552.jpg 1024w" sizes="(max-width: 1366px) 100vw, 1366px" /></p>
<p>Для того, чтобы создать список действий, открываем панель &#8220;инструменты&#8221; и видим раздел &#8220;мастер операций&#8221;. Создаем новую операцию. Для обработки документа в соответствии с моей поставленной задачей, сперва нужно распознать текст документа, поэтому первым добавляем &#8220;Распознать текст с помощью оптического распознавания символов OCR&#8221;. В настройках данного действия выбрать язык распознавания &#8220;Русский&#8221; и PDF на выходе &#8220;изображение с поиском (точно)&#8221;, сохраняем. Далее мне необходимо было определить ключевое слово по которому будут удалены страницы, содержащие данное слово.</p>
<p>Для этого был использован JS:</p>
<p><code>for (var p = 0; p &lt; this.numPages; p++)<br />
{<br />
var numWords = this.getPageNumWords(p);<br />
for (var i=0; i&lt;numWords; i++)<br />
{<br />
var ckWord = this.getPageNthWord(p, i, true);<br />
if ( ckWord == "<strong>Ключевое_слово</strong>")<br />
{<br />
this.deletePages(p);<br />
}<br />
}<br />
}</code></p>
<blockquote><p>В целях уменьшения задержек при воспроизведении операции, после каждого действия был добавлен шаг &#8220;Сохранить&#8221;. По каким то причинам операции с промежуточным шагом выполнялись быстрее.</p></blockquote>
<p>Добавляем из раздела &#8220;дополнительные инструменты&#8221; &#8220;выполнить сценарий javascript&#8221; и вставляем указанный код в окно настроек шага. Следующим шагом мы удаляем все пустые страницы. Так же добавляем &#8220;выполнить сценарий javascript&#8221; и в окно настроек шага вставляем код ниже.</p>
<p><code>for(var i=this.numPages-1;i&gt;=0;i--)<br />
{<br />
if(this.getPageNumWords(i)==0)<br />
this.deletePages(i);<br />
}</code></p>
<p>В конечном итоге, с учетом количества ключевых слов и промежуточных шагов сохранения документа, у меня получилось 8 шагов. <img decoding="async" class="aligncenter wp-image-5291 size-full" src="https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2.jpg" alt="" width="1366" height="736" srcset="https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2.jpg 1366w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2-150x81.jpg 150w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2-300x162.jpg 300w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2-768x414.jpg 768w, https://besfamilnij.ru/wp-content/uploads/2017/09/Adobe_acrobat_pro2-1024x552.jpg 1024w" sizes="(max-width: 1366px) 100vw, 1366px" /></p>
<p>Хочу заметить, качество работы операций по удалению страниц, зависит от качества документа, но в целом результаты удовлетворительны. По завершению обработки документов, следует проверить все файлы на наличие пропущенных страниц.</p>Запись <a href="https://besfamilnij.ru/__trashed-2/">Удаление пустых страниц из документов pdf с помощью JS Adobe Acrobat Pro</a> впервые опубликована на сайте <a href="https://besfamilnij.ru">BESFAMILNIJ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://besfamilnij.ru/__trashed-2/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
