Java에서 HttpURLConnection + ConvertStreamToString() 유틸리티를 사용하여 GitHub 파일 내용을 읽는 방법

게시 됨: 2017-12-30

HttpURLConnection을 사용하여 Github URL 콘텐츠 로드

이 Java 자습서에서는 HttpURLConnection을 사용하여 GitHub URL 콘텐츠를 검색하는 단계를 살펴보겠습니다. 즉, 아래는 GitHub에서 파일 콘텐츠를 가져오는 Java API입니다.

HttpURLConnection 인스턴스는 단일 요청을 만드는 데 사용되지만 HTTP 서버에 대한 기본 네트워크 연결은 다른 인스턴스에서 투명하게 공유할 수 있습니다. getHeaderFields() 헤더 필드의 수정 불가능한 맵을 반환합니다. 맵 키는 응답 헤더 필드 이름을 나타내는 문자열입니다. 각 맵 값은 해당 필드 값을 나타내는 수정 불가능한 문자열 목록입니다.

이제 시작하겠습니다.

  1. CrunchifyLoadGithubContent.java 클래스 생성
  2. 콘텐츠를 다운로드합니다: https://raw.githubusercontent.com/Crunchify/wp-super-cache/master/wp-cache.php (플러그인에서: WP Super Cache Github Repo)
  3. getHeaderFields() API를 사용하여 모든 헤더 필드를 가져옵니다. 위의 URL 또는 다른 URL이 리디렉션되는지 여부를 확인하려면 이것이 필요합니까? 참고: 이것은 완전히 선택 사항입니다. HTTP 301 및 HTTP 302 리디렉션의 경우 이것이 도움이 될 것입니다.
  4. 스트림을 문자열로 변환하는 API crunchifyGetStringFromStream( InputStream crunchifyStream) 을 만듭니다.
  5. 동일한 출력을 콘솔에 인쇄합니다.

참고: HTTP 상태 301은 리소스(페이지)가 새 위치로 영구적으로 이동되었음을 의미합니다. 302는 요청한 리소스가 일시적으로 다른 URI 아래에 있다는 것입니다. 301 대 302는 크롤러가 301을 사용할 때 이를 고려하고 페이지 순위를 전송하기 때문에 검색 엔진의 인덱싱에 중요합니다.

또한 GitHub URL이 공개되어야 한다는 가정이 있습니다.

디버깅하는 동안 crunchifyHeader 값의 일부로 이것을 얻었습니다. 또한 이 튜토리얼은 Bitbucket public repo에도 적용됩니다.

Java로 Github 콘텐츠 가져오기