지식의 공간/파이썬

비전공자의 파이썬 독학 6. 파이썬 문자열 자료형

빈테리 2024. 1. 14. 23:42

목차

    반응형

    파이썬에서 다루는 자료의 타입 중 문자열 자료형은 문자 또는 단어로 구성된 문자들의 집합을 말합니다. 쉽게 말해 텍스트를 의미하는데요, 파이썬에서 문자열 자료형을 나타내는 방법은 큰따옴표(") 또는 작은따옴표(')를 앞 뒤로 입력해 주는 것입니다.


    문자열 표현하기

    1. 기본 문자열 처리

    큰따옴표와 작은따옴표를 사용하여 간단하게 문자열 자료형으로 표현을 하는 이유는 큰따옴표 또는 작은따옴표를 문장의 구성요소로써 구분해 사용하기 위함입니다.

    예를 들면,
    >>> "I'm happy"
    I'm happy

     

    작은따옴표나 큰따옴표를 문장에 그대로 표현하기 위한 다른 방법으로는 \ 를 사용하는 것입니다. \" 또는 \'를 입력하면 " 또는 '가 문자열 안에 표현되어 출력됩니다. 위의 예시를 \ 백슬래시를 사용하여 다시 입력해 보면 다음과 같습니다.

    >>> "I\'m happy"
    I'm happy

     

    2. 문자열 줄 바꿈 처리

    긴 호흡의 문장을 문자열 자료형으로써 입력을 할 때는 여러 줄로 입력을 해야 하는데요, 이때는 줄 바꿈 처리를 위한 코드인 \n을 입력해 줍니다. 하지만 매번 해당 코드를 입력할 수 없으니 편의를 위해 길이가 긴 또는 여러 줄의 문자열 자료형을 입력할 때는 앞뒤로 큰따옴표 또는 작은따옴표를 연속으로 3개를 쓰기도 합니다.

     

    3. 문자열 탭 처리

    문자열 사이에 여백 또는 탭 간격을 적용하고 싶을 때는 \t를 입력합니다.


    문자열 연산하기

    문자열 연산에 있어서 덧셈과 곱셈이 있는데, 이는 문자열을 이어 붙이거나 반복해서 입력이 가능합니다.

    1. 문자열 덧셈, 곱셈

    문자열 + 문자열의 형태로 두 개 이상의 문자열을 이어 붙일 수 있습니다.

    예를 들면,
    >>> "Hi" + "Allen"
    Hi Allen

     

    이어 붙이기 말고 반복해서 입력을 하려면 반복하려는 횟수만큼 곱셈처리를 합니다.

    예를 들면,
    >>> "Hello" * 3
    HelloHelloHello

     


    문자열 인덱싱

    문자열을 나열했을 때 각 문자마다 번호를 매겨 특정한 값을 뽑아낼 때 인덱싱을 사용합니다. 파이썬에서 문자열은 1부터가 아닌 0부터 시작된다는 점을 기억해야 합니다. 대괄호 안에 숫자를 입력하면 해당 숫자에 위치한 문자가 출력이 됩니다.

    예를 들면,
    >>> a="My name is Jane"
    >>> a [3]
    n

    띄어쓰기 즉, 공백을 포함한 문자열 자릿수이기 때문에 세 번째 문자는 n이 됩니다. 뒤에서부터 인덱싱을 하려면 음수의 값을 입력하면 됩니다. 예를 들면, '-1'이란 맨 마지막 자리의 e를 의미하게 됩니다.


    문자열 슬라이싱

    문자열 인덱싱은 특정한 자리의 하나의 값을 추출해 낸다면, 슬라이싱은 범위로써 추출해 내는 방법입니다. [a:b]로 표현을 하며 :의 앞과 뒤에 입력하는 숫자가 슬라이싱을 하려는 문자열의 범위를 나타내줍니다. a 이상과 b미만으로 범위를 지정하기 때문에 : 뒤에 입력하는 숫자 자릿수의 값은 추출되지 않는 점을 주의해서 사용해야 합니다. a에 값을 생략해서 사용하여 [:b]를 입력하면 처음부터 b미만의 범위를 의미합니다. 반대로, [a:]로 입력하면 a부터 하여 끝까지의 범위를 의미하게 됩니다. 여기서 [a:b:c]로 두 개로 표현을 한다면 a이상 b미만까지 c간격으로 추출하기의 의미가 됩니다. 

    예를 들면,
    >>> a="My name is Jane"
    >>> a [2:5]   #2 이상 5 미만에 해당하는 문자열이 추출된 값으로 2, 3, 4 자리의 값이 추출됩니다.
    ' na'
    반응형