이론

텍스트 분석의 세계로! 구글 클라우드 Natural Language API 소개

Simon Yoon 2024. 1. 9. 20:28

안녕하세요, 여러분! 오늘은 구글 클라우드의 강력한 도구 중 하나인 Natural Language API에 대해 알아보려고 합니다.

텍스트 데이터를 다루고자 하는 모든 분야에서 유용하게 활용될 수 있는 이 API 는 어떤 기능을 제공하며, 어떻게 활용할 수 있는지 함께 살펴보겠습니다.

 

1. Google Natural Language API란?

Google Cloud의 Natural Language API는 사전 학습된 머신러닝 모델을 활용해서 텍스트 데이터를 처리하고 이해하는 데 사용되는 클라우드 기반의 서비스입니다.

구글이 사전에 만들어 놓은 자연어 처리 기술을 통해 텍스트에서 정보를 추출하고 감성 분석, 엔터티 인식, 문서 분류 등 다양한 언어 처리 작업을 수행할 수 있습니다.

중국어, 영어, 한국어, 일본어 등 여러 국가의 언어를 지원하고 있습니다.

 

Google Cloud Natural Language AI 에서 데모를 통해 테스트가 가능합니다

 

데모 예시와 함께 설명해보겠습니다.

 

2. 기능 소개

데모 예시와 함께 설명해보겠습니다.

최근에 아이폰 사생활 보호 액정필름을 구매했었는데, 해당 상품의 리뷰를 가지고 테스트 해보겠습니다.


2.1 감성 분석 (Sentiment Analysis): 텍스트의 감정을 긍정적, 부정적, 또는 중립적으로 분석하여 사용자의 의견을 이해합니다.

 

감성 분석 (Sentiment Analysis) 결과

 

해당 API 는 문서 단위, 문장 단위의 감성 분석 결과를 제공합니다.

감성 분석의 결과로는 -1 ~ +1 까지 감성 점수와 Magnitude 라고 하는 감정의 강도를 수치화해서 보여줍니다.

Magnitude 의 범위는 0 ~ +inf 까지 입니다. 즉, 숫자가 클수록 강도도 강한 것입니다.

 


2.2 엔터티 인식 (Entity Recognition): 텍스트에서 특정 엔터티(개체)를 인식하고 분류합니다. 사람 이름, 장소, 날짜, 조직 등을 자동으로 식별합니다.

 

엔터티 인식 (Entity Recognition) 결과

 

엔터티의 이름을 찾아서 분류해주는 기능입니다. 고유명사, 일반명사를 분류해줍니다.

사진에서는 각각 분류된 결과만 확인할 수 있는데 엔터티 타입, 확률 등도 받아올 수 있습니다.

 

 

2.3 문서 카테고리 분류 (Document Category Classification): 텍스트를 주제나 카테고리로 분류합니다.

 

문서 카테고리 분류 (Document Category Classification)

 

위 결과 화면을 보면 예시 리뷰에 대해서 가장 높은 Confidence 값을 가지는게 Mobile Phones 라는 것을 알 수 있습니다.

두 번째로 높은 Confidence 값을 가지는 카테고리가 Product Reviews & Price Comparisons 입니다.

꽤나 잘 맞추는 것 같네요.

 

2.4 민감한 문서 검토 (Moderate Text): 유해하고 민감한 카테고리에 대해 문서를 검토합니다.

유해성, 민감성 텍스트의 경우 해당 카테고리도 확인해 볼 수 있습니다.

 

민감한 문서 검토 (Moderate Text)

 

예시 리뷰 텍스트의 경우 민감 텍스트가 아니기 때문에 해당 분석은 무의미했습니다.

 

3. 어떻게 사용하나요?

Natural Language API를 사용하려면 구글 클라우드 플랫폼에서 프로젝트를 생성하고 API를 활성화해야 합니다. 그 후, API 키나 OAuth 인증 정보를 사용하여 API에 연결할 수 있습니다.

아래와 같이 직접 코드를 작성해서 API 를 사용할 수도 있습니다.

4. 활용 예시

4.1 감성 분석을 통한 제품 리뷰 분석: 제품 리뷰에서 사용자의 의견을 긍정적 또는 부정적으로 분석하여 제품 품질에 대한 피드백을 얻을 수 있습니다.

4.2 뉴스 기사의 주요 토픽 분류: 뉴스 기사를 자동으로 주요 토픽에 따라 분류하여 특정 주제에 대한 다양한 관점을 이해할 수 있습니다.

 


마치며

Natural Language API는 텍스트 데이터를 다루는데 있어 강력한 도구로서, 다양한 분야에서 활용될 수 있습니다. 텍스트 분석의 세계로 여러분을 안내하는 이 도구를 통해 데이터를 더욱 효과적으로 활용해보세요!

아래 링크에서 더 자세한 내용을 확인할 수 있습니다.

https://cloud.google.com/natural-language?hl=ko#section-2

 

Cloud Natural Language | Google Cloud

선행 학습된 API나 커스텀 AutoML 머신러닝 모델을 사용한 AI로 텍스트를 분석해 관련 항목을 추출하고 감정 등을 파악하세요.

cloud.google.com

 

감사합니다!