묭동이 개발 블로그
  • [Python] 문자열 함수
    2023년 12월 29일 20시 37분 06초에 업로드 된 글입니다.
    작성자: 묭동이

    파이썬에서 자주 사용하는 문자열 메서드 정리

    1. spit() 메서드

    • 특정 문자를 기준으로 문자열을 나눈 뒤, 리스트 형태로 반환하는 함수
    • 길이가 긴 문자열에 ,(콤마)와 같은 특정한 패턴이 있을 경우 유용하게 사용 가능
    • , (콤마)로 구분하기

    가장 기본적인 형태 ,(콤마)로 구분한 경우

    • ' '(공백)으로 구분하기

    공백으로 구분도 가능하다

    •  .로 구분하기
      '리스트' 형태로 반환하기 때문에 '인덱싱' 접근이 가능하다


    2. strip() : 필요없는 문자열 삭제

    • 앞, 뒤 공백 혹은 개행문자와 같이 불필요한 부분을 지우고 싶을 때 사용
    • 반환 type은 문자열이다.
      • <class 'str'>
    • 크롤링 혹은 웹스크래핑을 통해 불러온 데이터에 불필요한 데이터가 포함되어 있을 때 사용하면 유용할 것 같다
    • '공백' 삭제

    공백을 제거한 문자열 출력

    • 불필요한 'a' 문자 삭제

     

    • 두 개 이상의 문자가 들어간 경우에도 삭제가 가능하다

    • 공백과 개행문자가 함께 포함된 경우도 삭제가 가능하다

    • 텍스트의 왼쪽과 오른쪽만 처리하고 싶은 경우에는 어떻게 하면 될까?
      • .lstrip() : 해당 텍스트의 왼쪽만 처리(삭제)
      • .lstrip() : 해당 텍스트의 왼쪽만 처리(삭제)
    • lstrip()

    오른쪽의 ~는 삭제가 되지 않고 출력되는 것을 확인할 수 있다

    • rstrip()

    위 예시와 반대로 왼쪽의 ~만 삭제된 것을 확인할 수 있다


    3. join() : 문자열을 연결하는 메서드

    문자열의 경우 '+' 연산자로 두 문자열을 합치는 것이 가능하다.

     

    공백을 기준으로 list의 원소들을 연결하여 하나의 텍스트로 만든 예시와 -를 기준으로 list의 원소들을 하나의 텍스트로 만든 예시이다.

     

    join 메서드를 이용하여 리스트 내의 원소들을 연결한 것을 result 변수에 저장했고. result의 변수의 타입을 출력한 결과 str(문자열)인 것을 확인할 수 있다.

    join() 메서드로 얻은 결과의 타입을 출력


    4. find() : 문자열을 찾는 메서드

    • 문자열의 "시작하는" 위치 값(= 인덱스)을 반환
    • 존재하지 않는 문자의 경우 '-1'을 반환

    str_f 문자열의 'Python' 문자열은 '0'번 '인덱스'부터 시작하기 때문에 0을 반환하며 'Java'는 str_f 문자열에 존재하지 않기 때문에 -1이 반환된 것을 확인할 수 있다.


    5. count() : 찾고자 하는 문자열의 '횟수' 반환

    • 만약, 찾을 문자열이 없으면 '0' 반환
      • count가 되지 않아 0을 반환

    Python 문자(= 문자열)는(은) str_c 내에 3개 존재하므로 3을 반환하며 Java 문자(= 문자열)는(은) str_c 내에 존재하지 않기 때문에 0이 반환되는 것을 확인할 수 있다.


    6. startswith, endwith : 각 문자열이 지정된 문자로 시작하는지 또는 끝나는지 체크(검사)할 때 사용

    • 반환 타입(return type) : boolean(True / False)

    

    str_c 내에서 Python으로 시작하기 때문에 True가 반환된 것을 확인할 수 있으며 open으로 끝나기 때문에 마찬가지로 True가 반환된 것을 확인할 수 있다.

     

    공백을 구분하기 때문에 사용할 때 주의해야 할 것 같다 !


    7. replace() : 문자열 바꾸기

    • 지정한 문자열을 찾아서 바꾸는 메서드

    str_a 문자열의 Python이  IPython으로 바뀐 것을 확인할 수 있다.

     

    문자열 내에 괄호가 있는 경우 빈문자로 대체하여 없앨 수 있으며 이때 공백이 남기 때문에 위에서 배운 'rstrip()' 메서드를 통해 공백을 제거하여 출력결과를 확인할 수 있다.

     

     

    댓글