0
I have the following text file, except as texto.txt
:
Vamos testar nesse arquivo, aqui.
Temos que pedir para, que separe "todos os caracteres"!
Fazer, a contagem de letras?
Fazer a contagem de cada letra, que aparece aqui.
Fazer a contagem de linhas.
Esse texto contem 6 linhas.
Text has several symbols just to test string separation.
I wrote the following code to read the file:
with open('texto.txt', encoding='utf8') as arquivo:
letras = arquivo.read()
lista = letras.split(' ')
print(lista)
The read()
reads the entire file and saves it as a string in letters.
It turns out that when asking to display letters, the answer is:
['Temos', 'que', 'pedir', 'para,', 'que', 'separe', '"todos', 'os', 'caracteres"!\nFazer,', 'a','contagem', 'de', 'letras?\nFazer', 'a', 'contagem', 'de', 'cada', 'letra,', 'que', 'aparece','aqui.\nFazer', 'a', 'contagem', 'de', 'linhas.\nEsse', 'texto', 'contem', '6', 'linhas.']
Note that it is only separated where there is empty space.
How do I make him part too when I find ,.!?
, empty spaces and when you also find the \n
?