请问一下,如果想读取一个ppt等office文件中的所有数据,比如说转场动画,照片及其大小定位等信息。有没有什么好的推荐?
自己搜索了几天,就发现了3个相关的。
OpenOffice(LibreOffice)
office官方开发(不过需要在.net 上开发)
PHPPresentation。
但是office官网的应该是只支持做扩展应用,不符合我的需求。
PHPPresentation支持下却不是很强,读取的接口很多不支持。
所以就剩下了OpenOffice,这个选项,请问OpenOffice是否通过java编程对ppt里的内容进行读取?
或者还有什么好的建议?
공식 문서는 여기
링크
생각해보면 이 링크가 더 도움이 될 것 같습니다. . .
https://blogs.msdn.microsoft....
결국 xml 기반이라 읽는 부분은 기술적으로는 어렵지 않으나 실제로 해보면 조금 번거롭습니다
2003년 버전의 PPT 형식은 바이너리 형식으로, 세부 사항이 완전히 공개되지 않았습니다. 대부분의 타사 제조업체는 단방향 엔지니어링 방법을 사용하여 추측하고 분석했습니다. WPS는 더 나은 작업을 수행하지만 유일한 오픈 소스는 매우 열악한 작업을 수행하는 LibreOffice(이전 OpenOffice)입니다.
2007년 버전 이후의 PPTX 형식은 OOXML 공개 문서 사양을 기반으로 하며 기본적으로 XML 문서 및 관련 리소스를 압축한 ZIP 패키지입니다. OOXML 자체는 ISO 표준이 되어 공개되었습니다.
하지만. Office 문서의 기능은 매우 복잡합니다. 백만 줄이 넘는 코드로 구성된 Office 코드를 생각해 보세요. 오직 Microsoft Office만이 OOXML을 완벽하게 구현했으며 Office는 비공개 소스입니다. 따라서 OOXML을 직접 구문 분석하려면 매우 어렵습니다. LibreOffice의 자체 문서 사양 세트와 OOXML은 경쟁사이므로 상호 지원이 좋지 않습니다.
가능한 유일한 방법은 COM을 사용하여 Office 프로그래밍 인터페이스를 호출하는 것입니다. 이는 Office가 설치된 시스템에서만 사용할 수 있습니다. C++ 및 Microsoft Office SDK를 사용하려면 Visual Studio를 사용해야 합니다. 기본적으로 원본 데이터 구조를 얻을 수는 없지만 API 인터페이스를 하나씩 호출하고 콘텐츠를 하나씩 열거하고 속성 등을 얻을 수 있습니다. 이것이 Adobe Acrobat이 Word를 PDF로 변환하는 방법입니다.