英文分句/分段落

WBOY
풀어 주다: 2016-07-25 08:50:44
원래의
1897명이 탐색했습니다.
php环境,指出一个原本分句的时候的误区,分句不用考虑小数点,不用考虑域名,因为标准的句子是句号后面加空格的,唯一要考虑的就是Mr. Li 这种。
先采用分段落的方式是考虑到有些引用采用冒号结尾。
  1. /*TWWY'S ART*/
  2. function break_passage($text){ //分割段落
  3. return preg_split("/(\r|\n|\r\n)/", $text, -1, PREG_SPLIT_NO_EMPTY);
  4. }
  5. function break_sentence($text){ //分割句子 英文的句号后面必须有空格
  6. $re = '/# Split sentences on whitespace between them.
  7. (? [.!?] # Either an end of sentence punct,
  8. | [.!?][\'"] # or end of sentence punct and quote.
  9. ) # End positive lookbehind.
  10. (? Mr\. # Skip either "Mr."
  11. | Mrs\. # or "Mrs.",
  12. | Ms\. # or "Ms.",
  13. | Jr\. # or "Jr.",
  14. | Dr\. # or "Dr.",
  15. | Prof\. # or "Prof.",
  16. | Sr\. # or "Sr.",
  17. # or... (you get the idea).
  18. ) # End negative lookbehind.
  19. \s+ # Split on whitespace between sentences.
  20. /ix';
  21. $sentences = preg_split($re, $text, -1, PREG_SPLIT_NO_EMPTY);
  22. return $sentences;
  23. }
  24. function get_sentence($text){ //先分割段落再分割句子 [推荐]
  25. $passage = break_passage($text);
  26. $return = array();
  27. foreach ($passage as $key => $value) $return = array_merge($return, break_sentence($value));
  28. return $return;
  29. }
  30. ?>
复制代码


관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!