css·html·etc

pdf를 html로 변환하기

하나에하나 2016. 9. 27. 15:53

html 변환 요구사항이 있어


찾아보는데 첫번째로 pdf2htmlEX 라는 것이 걸렸다.


변환 후 깔끔하기로는 이게 최고인 것 같아 더는 안 찾아봤다.


https://github.com/coolwanglu/pdf2htmlEX


그런데 이게 활용하기가 내가 처한 환경과 맞지 않았다. 파이썬을 사용한 것 같은데.. 내가 아는 거라곤 htmll 뿐이니..


그래서 더 찾던 중


https://convertio.co/kr/pdf-html/


변환을 제공하는 웹사이트 발견하였고 변환시켜 보았더니 pdf2htmlEX를 활용하여 만든 사이트이더라.


행여나 웹사이트가 언제든 닫힐 수 있어 다른 걸 찾던 중


http://soft.rubypdf.com/software/pdf2htmlex-windows-version


윈도우 버전이 공개되어 있더라 원본 소스 보다는 낮은 버전인 것 같긴 하지만


아무것도 모르는 나에게 쓰기엔 이게 딱이다. (혹시나 이 사이트도 문을 닫을지 모르니 파일첨부)


pdf2htmlEX-win32-0.14.6-upx-with-poppler-data.zip


윈도우버전 사용법: 도스창에서  다운로드디렉토리\pdf2htmlEX.exe   변환할문서.pdf    변환될이름.html


좀 더 범용적이고 웹사이트에서 직접(리눅스 php 환경) 변환할 수 있는 소스가 있으면 리플로 공유해 주길 바란다.




pdf2htmlEX-win32-0.14.6-upx-with-poppler-data.zip
9.08MB