안녕하세요, 여러분! 오늘은 구글 클라우드의 강력한 도구 중 하나인 Natural Language API에 대해 알아보려고 합니다.
텍스트 데이터를 다루고자 하는 모든 분야에서 유용하게 활용될 수 있는 이 API 는 어떤 기능을 제공하며, 어떻게 활용할 수 있는지 함께 살펴보겠습니다.
1. Google Natural Language API란?
Google Cloud의 Natural Language API는 사전 학습된 머신러닝 모델을 활용해서 텍스트 데이터를 처리하고 이해하는 데 사용되는 클라우드 기반의 서비스입니다.
구글이 사전에 만들어 놓은 자연어 처리 기술을 통해 텍스트에서 정보를 추출하고 감성 분석, 엔터티 인식, 문서 분류 등 다양한 언어 처리 작업을 수행할 수 있습니다.
중국어, 영어, 한국어, 일본어 등 여러 국가의 언어를 지원하고 있습니다.
2. 기능 소개
데모 예시와 함께 설명해보겠습니다.
최근에 아이폰 사생활 보호 액정필름을 구매했었는데, 해당 상품의 리뷰를 가지고 테스트 해보겠습니다.
2.1 감성 분석 (Sentiment Analysis): 텍스트의 감정을 긍정적, 부정적, 또는 중립적으로 분석하여 사용자의 의견을 이해합니다.
해당 API 는 문서 단위, 문장 단위의 감성 분석 결과를 제공합니다.
감성 분석의 결과로는 -1 ~ +1 까지 감성 점수와 Magnitude 라고 하는 감정의 강도를 수치화해서 보여줍니다.
Magnitude 의 범위는 0 ~ +inf 까지 입니다. 즉, 숫자가 클수록 강도도 강한 것입니다.
2.2 엔터티 인식 (Entity Recognition): 텍스트에서 특정 엔터티(개체)를 인식하고 분류합니다. 사람 이름, 장소, 날짜, 조직 등을 자동으로 식별합니다.
엔터티의 이름을 찾아서 분류해주는 기능입니다. 고유명사, 일반명사를 분류해줍니다.
사진에서는 각각 분류된 결과만 확인할 수 있는데 엔터티 타입, 확률 등도 받아올 수 있습니다.
2.3 문서 카테고리 분류 (Document Category Classification): 텍스트를 주제나 카테고리로 분류합니다.
위 결과 화면을 보면 예시 리뷰에 대해서 가장 높은 Confidence 값을 가지는게 Mobile Phones 라는 것을 알 수 있습니다.
두 번째로 높은 Confidence 값을 가지는 카테고리가 Product Reviews & Price Comparisons 입니다.
꽤나 잘 맞추는 것 같네요.
2.4 민감한 문서 검토 (Moderate Text): 유해하고 민감한 카테고리에 대해 문서를 검토합니다.
유해성, 민감성 텍스트의 경우 해당 카테고리도 확인해 볼 수 있습니다.
예시 리뷰 텍스트의 경우 민감 텍스트가 아니기 때문에 해당 분석은 무의미했습니다.
3. 어떻게 사용하나요?
Natural Language API를 사용하려면 구글 클라우드 플랫폼에서 프로젝트를 생성하고 API를 활성화해야 합니다. 그 후, API 키나 OAuth 인증 정보를 사용하여 API에 연결할 수 있습니다.
아래와 같이 직접 코드를 작성해서 API 를 사용할 수도 있습니다.
4. 활용 예시
4.1 감성 분석을 통한 제품 리뷰 분석: 제품 리뷰에서 사용자의 의견을 긍정적 또는 부정적으로 분석하여 제품 품질에 대한 피드백을 얻을 수 있습니다.
4.2 뉴스 기사의 주요 토픽 분류: 뉴스 기사를 자동으로 주요 토픽에 따라 분류하여 특정 주제에 대한 다양한 관점을 이해할 수 있습니다.
마치며
Natural Language API는 텍스트 데이터를 다루는데 있어 강력한 도구로서, 다양한 분야에서 활용될 수 있습니다. 텍스트 분석의 세계로 여러분을 안내하는 이 도구를 통해 데이터를 더욱 효과적으로 활용해보세요!
아래 링크에서 더 자세한 내용을 확인할 수 있습니다.
https://cloud.google.com/natural-language?hl=ko#section-2
Cloud Natural Language | Google Cloud
선행 학습된 API나 커스텀 AutoML 머신러닝 모델을 사용한 AI로 텍스트를 분석해 관련 항목을 추출하고 감정 등을 파악하세요.
cloud.google.com
감사합니다!
'이론' 카테고리의 다른 글
이미지를 이해하는 마법, 합성곱 신경망(CNN) (2) | 2024.01.06 |
---|---|
FNet으로 Text Classification 해보기 (0) | 2022.11.03 |
DLRM(Deep Learning Recommendation Model) (0) | 2022.10.07 |
클라우드 컴퓨팅 - 3 (0) | 2022.08.20 |
클라우드 컴퓨팅 - 2 (0) | 2022.07.31 |