본문 바로가기
뉴스.경제.실시간이슈

엑셀으로 텍스트 추출하기

by 뷰티풀코리아 2024. 5. 8.
반응형

 

엑셀 텍스트 추출

한글 자소 추출

텍스트에서 한글 자소를 추출하는 방법은 다음과 같습니다.
text: 추출하려는 문자가 들어 있는 텍스트 문자열입니다.

그리고, 한글 "ㄱㅏㄴㅏㄷㅏ"는 6글자입니다. 엑셀을 사용하여 음절로 글자를 나눕니다. 영어 "ABC"는 3글자이고 한글 "가나다"도 3글자입니다. 글자 수를 기준으로 텍스트를 편집하는 함수에 대해 알아보겠습니다.

텍스트에 포함된 한글 자모 추출하기 텍스트에서 한글 자모를 추출하려면 다음과 같은 방법이 있습니다. 1. 정규식 사용하기: import re text = "가나다라마바사아자차카타파하" pattern = "[ㄱ-ㅎㅏ-ㅣ]" result = re.findall(pattern, text) print(result) 이렇게 하면 다음과 같은 결과가 나타납니다. ['가', '나', '다', '라', '마', '바', '사', '아', '자', '차', '카', '타', '파', '하'] 2. 포함 문자열 사용하기: text = "가나다라마바사아자차카타파하" result = [] for char in text: if char in "ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎㅏㅣ": result.append(char) print(result) 이렇게 하면 다음과 같은 결과가 나타납니다. ['가', '나', '다', '라', '마', '바', '사', '아', '자', '차', '카', '타', '파', '하'] 오른쪽에서 텍스트 추출: RIGHT 함수 문자나 숫자로 구성된 텍스트일 경우, RIGHT 함수는 텍스트나 숫자의 끝에서 지정한 개수의 문자나 숫자를 반환합니다. 즉, 해당 텍스트의 오른쪽 끝에서부터 왼쪽으로 지정한 개수만큼의 문자나 숫자를 반환합니다. 이때 텍스트의 길이는 문자의 개수로, 숫자의 길이는 숫자의 개수로 파악합니다. RIGHT 함수의 사용법은 다음과 같습니다. =RIGHT(텍스트, 개수) 텍스트: 오른쪽 끝에서부터 문자나 숫자를 추출할 텍스트입니다. 개수: 오른쪽 끝에서부터 추출할 문자나 숫자의 개수입니다. 음수인 경우 함수는 오류 값인 #VALUE!를 반환합니다. 예를 들어, 다음과 같은 함수를 사용하면 "서울특별시 서초구 방배동"이라는 문자열에서 끝에서부터 5글자를 추출하여 "방배동"을 반환합니다. =RIGHT("서울특별시 서초구 방배동", 5)

텍스트를 다룰 때, 문자열을 자르는 경우가 종종 있습니다.
특히 오른쪽에서 특정 길이의 문자를 추출해야 할 때, RIGHT 함수가 유용합니다.

RIGHT 함수는 매우 간단합니다. 텍스트 문자열의 마지막 문자부터 시작하여 지정한 문자 수만큼 문자를 반환합니다. 텍스트 위치의 기준점은 문자열의 마지막 문자입니다.

예를 들어, "도로명주소"라는 문자열에서 오른쪽에서 4자리를 추출하려면 다음과 같이 RIGHT 함수를 사용할 수 있습니다.

=RIGHT("도로명주소", 4)

이 경우 "주소"가 결과로 반환될 것입니다.

RIGHT 함수는 길이가 있는 모든 문자열에 사용할 수 있으며, 문자열에서 오른쪽부터 특정 길이의 문자를 추출하는 데 유용하게 사용할 수 있습니다.

주의:
RIGHT 함수는 텍스트 문자열의 오른쪽에서 지정한 수만큼의 문자를 반환합니다. 반환되는 문자 수가 텍스트 문자열의 길이보다 클 경우, 오류가 발생합니다.

RIGHT 함수는 텍스트의 오른쪽에서 지정한 개수의 문자를 추출하는 데 사용됩니다. 예를 들어, "안녕하세요"라는 문자열에서 오른쪽 3개 문자를 추출하려면 다음과 같이 RIGHT 함수를 사용하면 됩니다. =RIGHT("안녕하세요", 3) 이 결과는 "하세요"가 됩니다. RIGHT 함수는 LEFT 함수와 매우 유사하지만, 문자를 오른쪽에서 추출한다는 점이 다릅니다. 또한, RIGHT 함수는 문자열의 오른쪽에서 모든 문자를 추출하기 위해 =RIGHT("안녕하세요", 10)과 같이 인수를 생략할 수도 있습니다. RIGHT 함수는 텍스트에서 특정 정보를 추출하는 데 유용하게 사용할 수 있습니다. 예를 들어, 파일 이름에서 확장자를 추출하거나 전화번호에서 지역 코드를 추출하는 데 사용할 수 있습니다.

오른쪽에서 텍스트 추출: RIGHT 함수

오늘은 LEFT 함수와 쌍둥이 같은 RIGHT 함수에 대해 알아보겠습니다. LEFT 함수와 99% 동일하므로 간단히 살펴보겠습니다.

 

작업에 사용할 데이터를 입력해 보겠습니다.

 

데이터 RIGHT 함수 적용 결과
"Hello World!" "World!"
"123456789" "89"

이전 편에서는 왼쪽(LEFT) 함수를 사용하여 텍스트에서 추출하는 것을 살펴보았습니다. 지금부터는 중간(MID) 함수를 사용하여 텍스트에서 추출하는 것을 살펴보겠습니다. 다음과 같이 A1 셀에 값이 입력되어 있다고 가정해 봅시다. "김철수,19880508,서울특별시 강남구" 찾기(FIND) 함수는 전체 텍스트에서 지정한 문자가 몇 번째 위치에 있는지 반환하는 함수입니다. 오른쪽에서부터 세 번째 문자열 추출 "철수"라는 문자열을 추출하려면 다음과 같은 공식을 사용합니다. =MID(A1, FIND(",", A1, FIND(",", A1)+1)+1, 3) 이 공식에서는 FIND 함수를 중첩하여 두 번째 쉼표(,)의 위치를 찾은 다음 1을 더하여 시작 위치를 결정합니다. 그런 다음 3을 더하여 "철수"라는 문자열의 길이를 지정합니다. C2 셀에서 출생월 추출 출생월인 "05"를 추출하려면 다음과 같은 공식을 사용합니다. =MID(A1, FIND(",", A1, FIND(",", A1)+1)+1, 2) 이 공식에서는 찾기(FIND) 함수를 중첩하여 두 번째 쉼표(,)의 위치를 찾은 다음 1을 더하여 시작 위치를 마침표(.) 뒤로 설정합니다. 그런 다음 2를 더하여 "05"라는 문자열의 길이를 지정합니다.

MID 함수를 이용한 텍스트 추출

이전 게시물에서는 LEFT 함수를 이용한 텍스트 추출 방법을 살펴보았습니다. 이번에는 MID 함수를 사용하여 어떻게 텍스트를 추출하는지 알아보겠습니다.

문법

MID(text, start_num, num_chars)

  • text: 추출하고자 하는 텍스트가 있는 셀 주소
  • start_num: 추출 시작 위치 (1부터 시작)
  • num_chars: 추출할 문자 수

사용 예

다음과 같은 값이 A1 셀에 입력되어 있다고 가정합시다.

 

19900131

 

오른쪽에서 세 번째까지 추출하려면 다음 수식을 사용합니다.

MID(A1, LEN(A1)-2, 3)

C2 셀에 출생월을 추출하려면 다음 수식을 사용합니다.

MID(A1, 5, 2)

MID 함수는 문자열의 중간에서 특정 수의 문자를 추출하는 데 유용합니다. LEFT, RIGHT 함수는 좌우에서 연속적으로 추출하는 데 반해, MID 함수는 원하는 시작 위치와 추출 길이를 지정할 수 있습니다.

엑셀에서 텍스트 추출하기 엑셀에서 텍스트 추출 기능은 셀에서 특정 문자 또는 문자열을 추출하는 데 사용됩니다. 데이터에서 왼편에서 두 번째 텍스트를 추출하거나 오른쪽에서 세 번째 숫자를 추출하고자 하는 경우에 특히 유용합니다. 엑셀에서 텍스트 추출을 위해 일반적으로 사용되는 함수는 다음과 같습니다. LEFT 함수: 셀 왼편에서 지정된 수의 문자를 추출합니다. MID 함수: 셀 중간에서 지정된 위치에서 지정된 수의 문자를 추출합니다. RIGHT 함수: 셀 오른편에서 지정된 수의 문자를 추출합니다. 예를 들어, A1 셀에 "Hello World"가 있고 왼편에서 5개 문자를 추출하고자 한다면 다음과 같은 수식을 사용할 수 있습니다. =LEFT(A1, 5) 이 수식은 "Hello"를 반환합니다. 앰퍼샌드(&) 기호를 사용한 문자 합치기 앰퍼샌드(&) 기호를 사용하여 셀과 셀 또는 셀과 문자열을 연결할 수 있습니다. 이렇게 하면 숫자, 문자, 기호 등 서로 다른 데이터 유형을 하나의 텍스트 문자열로 통합할 수 있습니다. 예를 들어, A1 셀에 "Hello"가 있고 B1 셀에 "World"가 있다면 이 두 셀의 내용을 다음과 같이 연결할 수 있습니다. =A1&B1 이 수식은 "HelloWorld"를 반환합니다.

엑셀에서 텍스트 추출하기

엑셀에서 특정 텍스트를 추출하는 방법이 필요할 때가 있습니다. 예를 들어, 데이터값에서 왼쪽에서 두 번째 텍스트를 추출하거나 오른쪽에서 세 번째 숫자를 추출하려는 경우가 있을 수 있습니다. 이를 위해서는 텍스트 추출에 사용되는 left, mid, right 함수를 사용하면 됩니다.

셀 합치기

& 기호를 사용하여 셀과 셀 또는 셀과 입력 문자를 연결하여 문자를 합칠 수 있습니다. & 기호를 사용하면 숫자, 문자, 기호 등 셀에 있는 내용을 하나로 합칠 수 있습니다.

셀 A 셀 B 합친 문자열
이름 홍길동 이름: 홍길동
나이 30 나이: 30

엑셀에서 복잡한 데이터를 처리할 때, 원하는 텍스트를 추출하는 작업이 필요한 경우가 많이 있습니다. 텍스트 가공 기능을 사용하면 데이터를 효율적으로 정리하고 관리하는 데 도움이 될 수 있습니다.

엑셀에서 원하는 텍스트 추출하기

우리가 텍스트 데이터를 처리할 때 원하는 데이터만 골라내야 할 경우가 종종 있습니다. 이때는 엑셀의 다양한 함수와 기능을 사용하여 원하는 텍스트를 추출할 수 있습니다. 이 과정을 텍스트 가공이라고 합니다.

프로그램은 우리가 지정한 패턴에 따라 텍스트를 추출하기 때문에 우리의 의도와 다르게 추출될 수 있습니다. 예를 들어, "한국교통안전공단_건설기계조종사 정보현황_20201231"이라는 데이터에서 우리가 원하는 텍스트를 추출하려면 프로그램에 적절한 패턴을 지정해 주어야 합니다. 그렇지 않으면 의도하지 않은 결과가 나올 수 있습니다.

엑셀에서 텍스트 가공을 하려면 다음과 같은 단계를 따릅니다.

1. 먼저 다운로드할 예제 파일을 준비합니다.

2. 엑셀을 실행하고 예제 파일을 엽니다.

3. 편집 사용 또는 컨텐츠 허용이 팝업되면 클릭하여 적용합니다.

4. 원하는 텍스트를 추출할 셀을 선택합니다.

5. "수식" 탭을 클릭하여 수식을 입력합니다.

6. 원하는 텍스트를 추출하는 데 사용할 함수를 선택합니다.

7. 함수의 인수에 원하는 패턴을 입력합니다.

8. Enter 키를 눌러 수식을 확인합니다.

엑셀에서 텍스트 가공을 사용하면 데이터에서 원하는 텍스트를 빠르고 쉽게 추출할 수 있습니다.

 

 

❌타 카페나 블로그에 글을 게재하실 경우 글 하단에 출처를 반드시 표시해 주세요. ❌

 

 

 

https://www.lovevlystar.co.kr/ 

 

뷰티풀코리아

건강/여행/패션/뷰티//뉴스 정보전달 당신의 뷰티풀 라이프를 뷰티풀 코리아가 응원합니다

www.lovevlystar.co.kr

 

반응형

댓글