io
— Основные инструменты для работы с потоками¶
Обзор¶
Модуль io
предоставляет основные возможности Python для работы с
различными типами ввода-вывода. Существует три основных типа ввода-вывода:
текстовый I/O, бинарный I/O и необработанный I/O. Это общие категории,
и для каждой из них можно использовать различные поддерживаемые (backing)
хранилища. Объект, принадлежащий к любой из категорий, называется
файловым объектом. Другие
общие термины — поток и файловый объект.
Независимо от своей категории, у каждого объекта потока также будут различные возможности: он может быть доступен только для чтения, только для записи или чтения-записи. Он также может разрешать произвольный доступ (поиск вперед или назад в любое место) или только последовательный доступ (например, в случае сокета или канала (pipe)).
Все потоки внимательно относятся к типу данных, которые вы им предоставляете.
Например, передача объекта str
методу write()
двоичного потока
вызовет TypeError
. Так же как и предоставление объекта bytes
методу write()
текстового потока.
Изменено в версии 3.3: Операции, которые раньше вызывали IOError
, теперь вызывают
OSError
, поскольку IOError
теперь является псевдонимом
OSError
.
Текстовый ввод/вывод¶
Текстовый ввод-вывод ожидает и производит объекты str
. Это означает,
что всякий раз, когда поддерживаемое хранилище изначально состоит из байтов
(например, в случае файла), кодирование и декодирование данных выполняется
прозрачно, а также необязательный перевод специфичных для платформы символов
новой строки.
Самый простой способ создать текстовый поток — использовать open()
,
при желании указав кодировку:
f = open("myfile.txt", "r", encoding="utf-8")
Текстовые потоки в памяти также доступны как объекты StringIO
:
f = io.StringIO("some initial text data")
API текстового потока подробно описан в документации TextIOBase
.
Двоичный ввод/вывод¶
Двоичный ввод-вывод (также называемый буферизованный I/O) ожидает
байтовые объекты и производит
bytes
объекты. Кодирование,
декодирование или перевод новой строки не выполняется. Данная категория потоков
может использоваться для всех видов нетекстовых данных, а также когда требуется
ручное управление обработкой текстовых данных.
Самый простой способ создать двоичный поток — использовать open()
с
'b'
в строке режима:
f = open("myfile.jpg", "rb")
Двоичные потоки в памяти также доступны как объекты BytesIO
:
f = io.BytesIO(b"some initial binary data: \x00\x01")
API двоичного потока подробно описан в документации BufferedIOBase
.
Другие модули библиотеки могут предоставлять дополнительные способы создания
текстовых или двоичных потоков. См., например, socket.socket.makefile()
.
Необработанный ввод-вывод¶
Необработанный ввод-вывод (также называемый небуферизованный I/O) обычно используется в качестве низкоуровневого строительного блока для двоичных и текстовых потоков; редко бывает полезно напрямую управлять необработанным потоком из пользовательского кода. Тем не менее, вы можете создать необработанный поток, открыв файл в двоичном режиме с отключенной буферизацией:
f = open("myfile.jpg", "rb", buffering=0)
API необработанного потока подробно описан в документации RawIOBase
.
Интерфейс модуля высокого уровня¶
-
io.
DEFAULT_BUFFER_SIZE
¶ Тип int, содержащий размер буфера по умолчанию, используемый классами буферизованного ввода-вывода модуля.
open()
использует размер файла blksize (полученныйos.stat()
), если это возможно.
-
io.
open
(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)¶ Псевдоним встроенной функции
open()
.Функция вызывает событие аудита
open
с аргументамиpath
,mode
иflags
. Аргументыmode
иflags
могли быть изменены или выведены из исходного вызова.
-
io.
open_code
(path)¶ Открывает предоставленный файл в режиме
'rb'
. Функцию следует использовать, когда намерение состоит в том, чтобы рассматривать содержимое как исполняемый код.path
должен бытьstr
и абсолютным путём.Поведение функции может отменяться более ранним вызовом
PyFile_SetOpenCodeHook()
. Однако если предположить, чтоpath
—str
и абсолютный путь,open_code(path)
всегда должен вести себя так же, какopen(path, 'rb')
. Переопределение поведения предназначено для дополнительной проверки или предварительной обработки файла.Добавлено в версии 3.8.
-
exception
io.
BlockingIOError
¶ Псевдоним совместимости для встроенного исключения
BlockingIOError
.
-
exception
io.
UnsupportedOperation
¶ Исключение, наследующее
OSError
иValueError
, которое возникает при вызове неподдерживаемой операции в потоке.
Потоки в памяти¶
Также можно использовать str
или
байтовый объект в качестве
файла как для чтения, так и для записи. Для строк StringIO
может
использоваться как файл, открытый в текстовом режиме. BytesIO
можно
использовать как файл, открытый в двоичном режиме. Оба предоставляют полные
возможности чтения-записи с произвольным доступом.
См.также
sys
- Содержит стандартные потоки ввода-вывода:
sys.stdin
,sys.stdout
иsys.stderr
.
Иерархия классов¶
Реализация потоков ввода-вывода организована в виде иерархии классов. Сначала абстрактные базовые классы (ABC), которые используются для определения различных категорий потоков, затем классы, обеспечивающие стандартные реализации потоков.
Примечание
Абстрактные базовые классы также предоставляют реализации по умолчанию некоторых методов, чтобы помочь реализации потоковых классов. Например,
BufferedIOBase
предоставляет неоптимизированные реализацииreadinto()
иreadline()
.
На вершине иерархии ввода-вывода находится абстрактный базовый класс
IOBase
. Он определяет базовый интерфейс для потока. Обратите внимание,
однако, что нет разделения между чтением и записью в потоки; реализациям
разрешено вызывать UnsupportedOperation
, если они не поддерживают данную
операцию.
RawIOBase
ABC расширяет IOBase
. Он занимается чтением и
записью байтов в поток. FileIO
подклассы RawIOBase
для
обеспечения интерфейса для файлов в файловой системе компьютера.
BufferedIOBase
ABC занимается буферизацией необработанного байтового
потока (RawIOBase
). Его подклассы, BufferedWriter
,
BufferedReader
и BufferedRWPair
, буферные потоки, которые
доступны для чтения, записи, а также для чтения и записи.
BufferedRandom
предоставляет буферизованный интерфейс для потоков
произвольного доступа. Другой подкласс BufferedIOBase
,
BytesIO
, представляет собой поток байтов в памяти.
TextIOBase
ABC, другой подкласс IOBase
, работающий с
потоками, байты которых представляют текст, и обрабатывает кодирование и
декодирование в строки и из строк. TextIOWrapper
, который его
расширяет, представляет собой буферизованный текстовый интерфейс для
буферизованного необработанного потока (BufferedIOBase
). Наконец,
StringIO
— поток текста в памяти.
Имена аргументов не являются частью спецификации, и только аргументы
open()
предназначены для использования в качестве ключевых аргументов.
В следующей таблице приведены ABC, предоставляемые модулем io
:
ABC | Наследуется | Методы заглушки | Методы и свойства миксины |
---|---|---|---|
IOBase |
fileno , seek ,
и truncate |
close , closed , __enter__ ,
__exit__ , flush , isatty , __iter__ ,
__next__ , readable , readline ,
readlines , seekable , tell ,
writable , и writelines |
|
RawIOBase |
IOBase |
readinto и
write |
Унаследованные IOBase методы, read ,
и readall |
BufferedIOBase |
IOBase |
detach , read ,
read1 , и write |
Унаследованные IOBase методы, readinto ,
и readinto1 |
TextIOBase |
IOBase |
detach , read ,
readline , и
write |
Унаследованные IOBase методы, encoding ,
errors и newlines |
Базовые классы ввода-вывода¶
-
class
io.
IOBase
¶ Абстрактный базовый класс для всех классов ввода-вывода, воздействующий на потоки байтов. Общедоступного конструктора нет.
Класс предоставляет пустые абстрактные реализации для многих методов, выборочно переопределяемые производными классами; реализации по умолчанию представляют собой файл, который нельзя прочитать, записать или найти.
Несмотря на то, что
IOBase
не объявляетread()
илиwrite()
, потому что их сигнатуры будут различаться, реализации и клиенты должны рассматривать данные методы как часть интерфейса. Кроме того, реализации могут вызыватьValueError
(илиUnsupportedOperation
), когда вызываются операции, которые они не поддерживают.Базовый тип, используемый для двоичных данных
bytes
, считываемых из файла или записываемых в файл. Остальные байтовые объекты также принимаются в качестве аргументов метода. Классы текстового ввода-вывода работают сstr
данными.Обратите внимание, что вызов любого метода (даже запросов) в закрытом потоке не определён. В этом случае реализации могут вызвать
ValueError
.IOBase
(и его подклассы) поддерживает протокол итератора, что означает, что объектIOBase
может быть повторен, отдавая строки в потоке. Строки определяются немного по-разному в зависимости от того, является ли поток двоичным потоком (дающим байты) или текстовым потоком (дающим символьные строки). См.readline()
ниже.IOBase
также является менеджером контекста и поэтому поддерживает операторwith
. В примере file закрывается после завершения набора операторовwith
,— даже если возникает исключение:with open('spam.txt', 'w') as file: file.write('Spam and eggs!')
IOBase
предоставляет следующие атрибуты данных и методы:-
close
()¶ Сбросить и закрыть поток. Метод не действует, если файл уже закрыт. После закрытия файла любая операция с файлом (например, чтение или запись) вызовет
ValueError
.Для удобства можно вызывать данный метод более одного раза; однако только первый вызов будет приводить к эффекту.
-
closed
¶ True
, если поток закрыт.
-
fileno
()¶ Возвращает базовый файловый дескриптор (целое число) потока, если он существует. Возникает
OSError
, если объект ввода-вывода не использует файловый дескриптор.
-
flush
()¶ Если возможно, очистите буферы записи потока. Ничего не делает для потоков, предназначенных только для чтения и неблокирующих потоков.
-
isatty
()¶ Возвращает
True
, если поток интерактивный (т.е. подключён к терминалу/tty-устройству).
-
readline
(size=-1)¶ Читает и возвращает одну строку из потока. Если указан size, будет прочитано не более size байтов.
Для двоичных файлов терминатор строки всегда
b'\n'
; для текстовых файлов аргумент newline дляopen()
может использоваться для выбора распознаваемых ограничителей строки.
-
readlines
(hint=-1)¶ Читает и возвращает список строк из потока. hint можно указать для управления количеством прочитанных строк: больше не будут считываться строки, если общий размер (в байтах/символах) всех строк на данный момент превышает hint.
Обратите внимание, что уже можно выполнять итерацию файловых объектов с помощью
for line in file: ...
без вызоваfile.readlines()
.
-
seek
(offset, whence=SEEK_SET)¶ Изменить позицию потока на данный байтовый offset. offset интерпретируется относительно позиции, обозначенной whence. Значение по умолчанию для whence —
SEEK_SET
. Значения для whence равны:SEEK_SET
или0
— начало потока (по умолчанию); offset должен быть нулевым или положительным.SEEK_CUR
или1
— текущая позиция в потоке; offset может быть отрицательным.SEEK_END
или2
— конец потока; offset обычно отрицательный.
Возвращает новую абсолютную позицию.
Добавлено в версии 3.1: Константы
SEEK_*
.Добавлено в версии 3.3: Некоторые операционные системы могут поддерживать дополнительные значения, например
os.SEEK_HOLE
илиos.SEEK_DATA
. Допустимые значения для файла могут зависеть от того, открыт ли он в текстовом или двоичном режиме.
-
seekable
()¶ Возвращает
True
, если поток поддерживает произвольный доступ. ЕслиFalse
,seek()
,tell()
иtruncate()
вызовутOSError
.
-
tell
()¶ Возвращает текущую позицию потока.
-
truncate
(size=None)¶ Изменить размер потока до заданного size в байтах (или текущей позиции, если size не указан). Текущая позиция в потоке не изменяется. Изменение размера может увеличить или уменьшить текущий размер файла. В случае расширения содержимое новой файловой области зависит от платформы (в большинстве систем дополнительные байты заполняются нулями). Возвращается новый размер файла.
Изменено в версии 3.5: Windows теперь будет заполнять файлы нулями при расширении.
-
writable
()¶ Возвращает
True
, если поток поддерживает запись. ЕслиFalse
,write()
иtruncate()
вызовутOSError
.
-
writelines
(lines)¶ Записать список строк в поток. Разделители строк не добавляются, поэтому обычно у каждой из предоставленных строк есть разделитель строк в конце.
-
-
class
io.
RawIOBase
¶ Базовый класс для необработанного двоичного ввода-вывода. Он наследует
IOBase
. Общедоступного конструктора нет.Необработанный двоичный ввод-вывод обычно предоставляет низкоуровневый доступ к базовому устройству ОС или API и не пытается инкапсулировать его в высокоуровневые примитивы (оставлено для буферизованного ввода-вывода и текстового ввода-вывода, описанного ниже на этой странице).
Помимо атрибутов и методов из
IOBase
,RawIOBase
предоставляет следующие методы:-
read
(size=-1)¶ Читает до size байт из объекта и возвращает их. Для удобства, если size не указан или -1, возвращаются все байты до EOF. В противном случае выполняется только один системный вызов. Может возвращаться меньше size байт, если вызов операционной системы возвращает меньше size байт.
Если возвращается 0 байтов, а size не был 0, это указывает на конец файла. Если объект находится в неблокирующем режиме и нет доступных байтов, возвращается
None
.Реализация по умолчанию относится к
readall()
иreadinto()
.
-
readall
()¶ Читает и возвращает все байты из потока до EOF, используя при необходимости несколько вызовов потока.
-
readinto
(b)¶ Считывает байты в заранее выделенный, доступный для записи байтовым объектом b и возвращает количество прочитанных байтов. Например, b может быть
bytearray
. Если объект находится в неблокирующем режиме и нет доступных байтов, возвращаетсяNone
.
-
write
(b)¶ Записать заданный байтовый объект, b в базовый необработанный поток и возвращает количество записанных байтов. Может быть меньше, чем длина b в байтах, в зависимости от специфики базового необработанного потока, особенно если он находится в неблокирующем режиме.
None
возвращается, если необработанный поток не настроен на блокировку и ни один байт не может быть легко записан в него. Вызывающий может освободить или изменить b после возврата из этого метода, поэтому реализация должна обращаться к b только во время вызова метода.
-
-
class
io.
BufferedIOBase
¶ Базовый класс для двоичных потоков, поддерживающих какую-то буферизацию. Он наследует
IOBase
. Общедоступного конструктора нет.Основное отличие от
RawIOBase
заключается в том, что методыread()
,readinto()
иwrite()
будут пытаться (соответственно) прочитать столько ввода, сколько запрошено, или использовать весь данный вывод за счет выполнения, возможно, более одного системного вызова.Кроме того, данные методы могут вызывать
BlockingIOError
, если базовый необработанный поток находится в неблокирующем режиме и не может принимать или передавать достаточно данных; в отличие от своих аналоговRawIOBase
, они никогда не вернутNone
.Кроме того, у метода
read()
нет реализации по умолчанию, относящейся кreadinto()
.Типичная реализация
BufferedIOBase
не должна наследовать от реализацииRawIOBase
, а должна оборачиваться, как это делаютBufferedWriter
иBufferedReader
.BufferedIOBase
предоставляет или переопределяет данные методы и атрибуты в дополнение к тем изIOBase
:-
raw
¶ Базовый необработанный поток (экземпляр
RawIOBase
), с которым работаетBufferedIOBase
. Не является частью APIBufferedIOBase
и может отсутствовать в некоторых реализациях.
-
detach
()¶ Отделить базовый необработанный поток от буфера и возвращает его.
После отсоединения необработанного потока буфер находится в непригодном для использования состоянии.
У некоторых буферов, таких как
BytesIO
, нет концепции единого необработанного потока, возвращаемого данным методом. ВызываетUnsupportedOperation
.Добавлено в версии 3.1.
-
read
(size=-1)¶ Чтение и возвращение до size байт. Если аргумент пропущен,
None
или отрицательный, данные считываются и возвращаются до достижения EOF. Пустой объектbytes
возвращается, если поток уже находится в EOF.Если аргумент положительный, а базовый необработанный поток не является интерактивным, может быть выполнено несколько необработанных чтений, чтобы удовлетворить счетчику байтов (если EOF не будет достигнут первым). Но для интерактивных необработанных потоков будет выполнено не более одного необработанного чтения, и короткий результат не означает, что EOF неизбежен.
BlockingIOError
возникает, если базовый необработанный поток находится в неблокирующем режиме и в настоящий момент нет доступных данных.
-
read1
([size])¶ Чтение и возвращение до size байт с помощью не более одного вызова метода
read()
(илиreadinto()
) базового необработанного потока. Может быть полезно, если вы реализуете собственную буферизацию поверх объектаBufferedIOBase
.Если size —
-1
(по умолчанию), возвращается произвольное количество байтов (больше нуля, если не достигнут EOF).
-
readinto
(b)¶ Считывает байты в заранее выделенный, доступный для записи байтовый объект b и возвращает количество прочитанных байтов. Например, b может быть
bytearray
.Как и
read()
, базовому необработанному потоку может быть выполнено несколько операций чтения, если последний не является интерактивным.BlockingIOError
возникает, если базовый необработанный поток находится в неблокирующем режиме и в данный момент нет доступных данных.
-
readinto1
(b)¶ Читает байты в предварительно выделенный, доступный для записи байтового объекта b, используя не более одного вызова метода
read()
(илиreadinto()
) базового необработанного потока. Возвращает количество прочитанных байтов.BlockingIOError
возникает, если базовый необработанный поток находится в неблокирующем режиме и в настоящий момент нет доступных данных.Добавлено в версии 3.5.
-
write
(b)¶ Пишет заданный байтовый объект b и возвращает количество записанных байтов (всегда равное длине b в байтах, поскольку в случае сбоя записи будет вызвано
OSError
). В зависимости от фактической реализации эти байты могут быть легко записаны в базовый поток или сохранены в буфере по причинам производительности и задержки.В неблокирующем режиме вызывается
BlockingIOError
, если данные необходимо записать в необработанный поток, но он не может принять все данные без блокировки.Вызывающий может освободить или изменить b после возврата из этого метода, поэтому реализация должна обращаться к b только во время вызова метода.
-
Ввод-вывод необработанных файлов¶
-
class
io.
FileIO
(name, mode='r', closefd=True, opener=None)¶ FileIO
представляет собой файл уровня ОС, содержащий данные в байтах. Он реализует интерфейсRawIOBase
(и, следовательно, интерфейсIOBase
).name может быть одним из двух:
- символьная строка или объект
bytes
, представляющий путь к файлу, который будет открыт. В этом случае значение closefd должно бытьTrue
(по умолчанию), иначе возникнет ошибка. - целое число, представляющее номер существующего файлового дескриптора
уровня ОС, к которому получившийся объект
FileIO
предоставит доступ. Когда объект FileIO закрыт, этот fd также будет закрыт, если closefd не установлен вFalse
.
mode может быть
'r'
,'w'
,'x'
или'a'
для чтения (по умолчанию), записи, исключительного создания или добавления. Файл будет создан, если он не существует при открытии для записи или добавления; он будет обрезан при открытии для записи. Будет вызваноFileExistsError
, если он уже существует при открытии для создания. Открытие файла для создания подразумевает запись, поэтому этот режим ведет себя аналогично'w'
. Добавьте'+'
в режим, чтобы разрешить одновременное чтение и запись.Методы
read()
(при вызове с положительным аргументом),readinto()
иwrite()
этого класса будут выполнять только один системный вызов.Можно использовать настраиваемый открыватель, передав вызываемый объект как opener. Базовый файловый дескриптор для файлового объекта получается путём вызова opener с (name, flags). opener должен возвращать дескриптор открытого файла (передача
os.open
как opener приводит к функциональности, аналогичной передачеNone
).Вновь созданный файл — ненаследуемый.
См. встроенную функцию
open()
для примеров использования параметра opener.Изменено в версии 3.3: Добавлен параметр opener. Добавлен режим
'x'
.Изменено в версии 3.4: Теперь файл не наследуется.
Помимо атрибутов и методов из
IOBase
иRawIOBase
,FileIO
предоставляет следующие атрибуты данных:-
mode
¶ Режим, указанный в конструкторе.
-
name
¶ Имя файла. Файловый дескриптор файла, если в конструкторе не указано имя.
- символьная строка или объект
Буферизованные потоки¶
Буферизованные потоки ввода-вывода предоставляют интерфейс более высокого уровня для устройства ввода-вывода, чем необработанный ввод-вывод.
-
class
io.
BytesIO
([initial_bytes])¶ Реализация потока с использованием байтового буфера в памяти. Он наследует
BufferedIOBase
. Буфер сбрасывается при вызове методаclose()
.Необязательный аргумент initial_bytes — байтовый объект, который содержит исходные данные.
BytesIO
предоставляет или отменяет данные методы в дополнение к методам изBufferedIOBase
иIOBase
:-
getbuffer
()¶ Возвращает доступное для чтения и записи представление содержимого буфера без его копирования. Кроме того, изменение представления прозрачно обновит содержимое буфера:
>>> b = io.BytesIO(b"abcdef") >>> view = b.getbuffer() >>> view[2:4] = b"56" >>> b.getvalue() b'ab56ef'
Примечание
Пока существует представление, нельзя изменить размер или закрыть объект
BytesIO
.Добавлено в версии 3.2.
-
read1
([size])¶ В
BytesIO
это то же самое, что иread()
.Изменено в версии 3.7: Аргумент size теперь необязателен.
-
readinto1
(b)¶ В
BytesIO
это то же самое, что иreadinto()
.Добавлено в версии 3.5.
-
-
class
io.
BufferedReader
(raw, buffer_size=DEFAULT_BUFFER_SIZE)¶ Буфер, обеспечивающий доступ более высокого уровня к читаемому последовательному объекту
RawIOBase
. Он наследуетBufferedIOBase
. При чтении данных из этого объекта может запрашиваться больший объем данных из базового необработанного потока и сохранён во внутреннем буфере. Буферизованные данные могут возвращаться непосредственно при последующих чтениях.Конструктор создаёт
BufferedReader
для данного читаемого потока raw и buffer_size. Если buffer_size пропущен, используетсяDEFAULT_BUFFER_SIZE
.BufferedReader
предоставляет или отменяет эти методы в дополнение к методам изBufferedIOBase
иIOBase
:-
peek
([size])¶ Возвращение байтов из потока без продвижения позиции. Для удовлетворения запроса выполняется не более одного однократного чтения необработанного потока. Количество возвращенных байтов может быть меньше или больше запрошенного.
-
read
([size])¶ Читает и возвращает size байтов, или, если size не задано или отрицательно, до EOF или если вызов чтения блокируется в неблокирующем режиме.
-
read1
([size])¶ Чтение и возвращение до size байтов только с одним вызовом необработанного потока. Если в буфере находится хотя бы один байт, возвращаются только буферизованные байты. В противном случае выполняется один вызов чтения необработанного потока.
Изменено в версии 3.7: Аргумент size теперь необязателен.
-
-
class
io.
BufferedWriter
(raw, buffer_size=DEFAULT_BUFFER_SIZE)¶ Буфер, обеспечивающий высокоуровневый доступ к записываемому последовательному объекту
RawIOBase
. Он наследуетBufferedIOBase
. При записи в этот объект данные обычно помещаются во внутренний буфер. Буфер будет записан в базовый объектRawIOBase
при различных условиях, в том числе:- когда буфер становится слишком маленьким для всех ожидающих данных;
- когда вызывается
flush()
; - при запросе
seek()
(для объектовBufferedRandom
); - когда объект
BufferedWriter
закрыт или уничтожен.
Конструктор создаёт
BufferedWriter
для данного записываемого потока raw. Если buffer_size не указан, по умолчанию используетсяDEFAULT_BUFFER_SIZE
.BufferedWriter
предоставляет или отменяет данные методы в дополнение к методам изBufferedIOBase
иIOBase
:-
flush
()¶ Перевести байты, хранящиеся в буфере, в необработанный поток. Если необработанный поток блокируется, следует вызвать
BlockingIOError
.
-
write
(b)¶ Записать байтовый объект, b и возвращает количество записанных байтов. В неблокирующем режиме возникает
BlockingIOError
, если необходимо записать буфер, но необработанный поток блокируется.
-
class
io.
BufferedRandom
(raw, buffer_size=DEFAULT_BUFFER_SIZE)¶ Буферизованный интерфейс для потоков произвольного доступа. Он наследует
BufferedReader
иBufferedWriter
.Конструктор создаёт средства чтения и записи для исходного потока с возможностью поиска, указанного в первом аргументе. Если buffer_size пропущен, по умолчанию используется
DEFAULT_BUFFER_SIZE
.BufferedRandom
способен на всё, что может сделатьBufferedReader
илиBufferedWriter
. Кроме того, гарантированно будут реализованыseek()
иtell()
.
-
class
io.
BufferedRWPair
(reader, writer, buffer_size=DEFAULT_BUFFER_SIZE)¶ Буферизованный объект ввода-вывода, объединяющий два однонаправленных объекта
RawIOBase
— один для чтения, другой для записи — в одну двунаправленную конечную точку. Он наследуетBufferedIOBase
.reader и writer — объекты
RawIOBase
, которые доступны для чтения и записи соответственно. Если buffer_size пропущен, по умолчанию используетсяDEFAULT_BUFFER_SIZE
.BufferedRWPair
реализует все методыBufferedIOBase
, за исключениемdetach()
, который вызываетUnsupportedOperation
.Предупреждение
BufferedRWPair
не пытается синхронизировать доступ к своим базовым необработанным потокам. Вы не должны передавать ему тот же объект, что и читатель и писатель; использовать вместо негоBufferedRandom
.
Текстовый ввод/вывод¶
-
class
io.
TextIOBase
¶ Базовый класс для текстовых потоков. Класс предоставляет символьный и линейный интерфейс для потокового ввода-вывода. Он наследует
IOBase
. Общедоступного конструктора нет.TextIOBase
предоставляет или отменяет эти атрибуты данных и методы в дополнение к атрибутам изIOBase
:-
encoding
¶ Имя кодировки, используемой для декодирования байтов потока в строки и для кодирования строк в байты.
-
errors
¶ Ошибка настройки декодера или кодировщика.
-
newlines
¶ Строка, кортеж строк или
None
, указывающий на переведенные на данный момент новые строки. В зависимости от реализации и начальных флагов конструктора может быть недоступно.
-
buffer
¶ Базовый двоичный буфер (экземпляр
BufferedIOBase
), с которым работаетTextIOBase
. Не является частью APITextIOBase
и может отсутствовать в некоторых реализациях.
-
detach
()¶ Отделить нижележащий двоичный буфер от
TextIOBase
и возвращает его.После отсоединения нижележащего буфера
TextIOBase
находится в непригодном для использования состоянии.Некоторые реализации
TextIOBase
(например,StringIO
) могут не содержать концепции базового буфера, и вызов этого метода вызоветUnsupportedOperation
.Добавлено в версии 3.1.
-
read
(size=-1)¶ Читает и возвращает не более size символов из потока как один
str
. Если size отрицательное значение илиNone
, считывается до EOF.
-
readline
(size=-1)¶ Читает до новой строки или EOF и возвращает один
str
. Если поток уже находится в EOF, возвращается пустая строка.Если указан size, будет прочитано не более size символов.
-
seek
(offset, whence=SEEK_SET)¶ Изменить позицию потока на данную offset. Поведение зависит от параметра whence. Значение по умолчанию для whence —
SEEK_SET
.SEEK_SET
или0
: поиск с начала потока (по умолчанию); offset должен быть либо числом, возвращаемымTextIOBase.tell()
, либо нулем. Любое другое значение offset приводит к неопределенному поведению.SEEK_CUR
или1
: «поиск» к текущей позиции; offset должен быть равен нулю, что не является операцией (все другие значения не поддерживаются).SEEK_END
или2
: перейти к концу потока; offset должен быть равен нулю (все остальные значения не поддерживаются).
Возвращает новую абсолютную позицию как непрозрачное число.
Добавлено в версии 3.1: Константы
SEEK_*
.
-
tell
()¶ Возвращает текущую позицию в потоке как непрозрачное число. Число обычно не представляет собой количество байтов в базовом двоичном хранилище.
-
write
(s)¶ Записывает в поток строку s и возвращает количество записанных символов.
-
-
class
io.
TextIOWrapper
(buffer, encoding=None, errors=None, newline=None, line_buffering=False, write_through=False)¶ Буферизованный текстовый поток через двоичный поток
BufferedIOBase
. Он наследуетTextIOBase
.encoding предоставляет имя кодировки, с помощью которой будет декодироваться или кодироваться поток. По умолчанию это
locale.getpreferredencoding(False)
.errors — необязательная строка, указывающая, как должны обрабатываться ошибки кодирования и декодирования. Передайте
'strict'
, чтобы вызвать исключениеValueError
, если есть ошибка кодирования (у значения по умолчаниюNone
тот же эффект), или передайте'ignore'
, чтобы игнорировать ошибки. (Обратите внимание, что игнорирование ошибок кодирования может привести к потере данных.)'replace'
вызывает вставку замещающего маркера (например,'?'
) там, где есть искаженные данные.'backslashreplace'
вызывает замену искаженных данных escape-последовательностью с обратной косой чертой. При записи можно использовать'xmlcharrefreplace'
(заменить соответствующей ссылкой на символ XML) или'namereplace'
(заменить escape- последовательностями\N{...}
). Любое другое имя обработки ошибок, зарегистрированное вcodecs.register_error()
, также является допустимым.newline управляет обработкой окончаний строк. Может быть
None
,''
,'\n'
,'\r'
и'\r\n'
. Работает следующим образом:- При чтении ввода из потока, если newline —
None
, включён режим универсальный символ новой строки. Строки во входных данных могут заканчиваться на'\n'
,'\r'
или'\r\n'
, и они преобразуются в'\n'
перед возвратом вызывающей стороне. Если это''
, включён универсальный режим новой строки, но окончания строк возвращаются вызывающей стороне непереведёнными. Если у него любое из других допустимых значений, строки ввода завершаются только данной строкой, а окончание строки возвращается вызывающей стороне в непереведённом виде. - При записи вывода в поток, если newline —
None
, любые записанные символы'\n'
переводятся в системный разделитель строк по умолчанию,os.linesep
. Если newline —''
или'\n'
, перевод не выполняется. Если newline — любое другое допустимое значение, любые записанные символы'\n'
переводятся в данную строку.
Если line_buffering —
True
,flush()
подразумевается, когда вызов write содержит символ новой строки или возврат каретки.Если write_through —
True
, вызовыwrite()
гарантированно не буферизуются: любые данные, записанные в объектеTextIOWrapper
, немедленно обрабатываются в его базовый двоичный файл buffer.Изменено в версии 3.3: Добавлен аргумент write_through.
Изменено в версии 3.3: По умолчанию encoding теперь
locale.getpreferredencoding(False)
вместоlocale.getpreferredencoding()
. Не меняйте временно кодировку локали с помощьюlocale.setlocale()
, используйте текущую кодировку локали вместо кодировки, предпочитаемой пользователем.TextIOWrapper
предоставляет ряд атрибутов в дополнение к атрибутамTextIOBase
и его родителям:-
line_buffering
¶ Включена ли буферизация строки.
-
write_through
¶ Передаются ли записи немедленно в базовый двоичный буфер.
Добавлено в версии 3.7.
-
reconfigure
(*[, encoding][, errors][, newline][, line_buffering][, write_through])¶ Изменить конфигурацию текстового потока, используя новые настройки для encoding, errors, newline, line_buffering и write_through.
Не указанные параметры сохраняют текущие настройки, за исключением того, что используется
errors='strict'
, когда указано encoding, но не указано errors.Невозможно изменить кодировку или новую строку, если некоторые данные уже были прочитаны из потока. С другой стороны, изменение кодировки после записи возможно.
Метод выполняет неявную очистку потока перед установкой новых параметров.
Добавлено в версии 3.7.
- При чтении ввода из потока, если newline —
-
class
io.
StringIO
(initial_value='', newline='\n')¶ Поток в памяти для текстового ввода-вывода. Текстовый буфер удаляется при вызове метода
close()
.Начальное значение буфера можно установить, указав initial_value. Если перевод новой строки включён, новые строки будут закодированы как
write()
. Поток располагается в начале буфера.Аргумент newline работает аналогично аргументу
TextIOWrapper
. По умолчанию в качестве концов строк рассматриваются только символы\n
и не выполняется перевод новой строки. Если для newline установлено значениеNone
, символы новой строки записываются как\n
на всех платформах, но универсальное декодирование новой строки по-прежнему выполняется при чтении.StringIO
предоставляет следующий метод в дополнение к методам изTextIOBase
и его родителей:-
getvalue
()¶ Возвращает
str
, содержащий всё содержимое буфера. Новые строки декодируются какread()
, хотя позиция в потоке не изменяется.
Пример использования:
import io output = io.StringIO() output.write('First line.\n') print('Second line.', file=output) # Получить содержимое файла - это будет # 'First line.\nSecond line.\n' contents = output.getvalue() # Закрыть объект и сбросить буфер памяти - # .getvalue() теперь вызовет исключение. output.close()
-
-
class
io.
IncrementalNewlineDecoder
¶ Вспомогательный кодек, декодирующий символы новой строки для режима универсальный символ новой строки. Он наследует
codecs.IncrementalDecoder
.
Производительность¶
В этом разделе обсуждается производительность предоставленных реализаций ввода-вывода.
Двоичный ввод/вывод¶
За счёт чтения и записи только больших блоков данных, даже когда пользователь запрашивает один байт, буферизованный ввод-вывод скрывает любую неэффективность при вызове и выполнении небуферизованных процедур ввода-вывода операционной системы. Прирост зависит от ОС и типа выполняемого ввода-вывода. Например, в некоторых современных ОС (например, Linux) небуферизованный дисковый ввод-вывод может быть таким же быстрым, как и буферизованный ввод-вывод. Суть в том, что буферизованный ввод-вывод обеспечивает предсказуемую производительность независимо от платформы и устройства поддержки. Следовательно, почти всегда предпочтительнее использовать буферизованный ввод-вывод, а не небуферизованный ввод-вывод для двоичных данных.
Текстовый ввод/вывод¶
Текстовый ввод-вывод в двоичном хранилище (таком как файл) значительно
медленнее, чем двоичный ввод-вывод в том же хранилище, потому что он требует
преобразования между Юникодом и двоичными данными с использованием символьного
кодека. Может стать заметным при обработке огромных объёмов текстовых
данных, таких как большие файлы журналов. Кроме того,
TextIOWrapper.tell()
и TextIOWrapper.seek()
работают довольно
медленно из-за используемого алгоритма восстановления.
StringIO
, однако, является встроенным юникод контейнером в памяти и
будет демонстрировать скорость, аналогичную BytesIO
.
Многопоточность¶
Объекты FileIO
являются потокобезопасными в той степени, в которой
оборачиваемые вызовы операционной системы (например, read(2)
в Unix),
также являются потокобезопасными.
Объекты с двоичной буферизацией (экземпляры BufferedReader
,
BufferedWriter
, BufferedRandom
и BufferedRWPair
)
защищают свои внутренние структуры с помощью блокировки; поэтому их можно
безопасно вызывать сразу из нескольких потоков.
Объекты TextIOWrapper
не являются потокобезопасными.
Реентерабельность¶
Объекты с двоичной буферизацией (экземпляры BufferedReader
,
BufferedWriter
, BufferedRandom
и BufferedRWPair
) не
реентерабельны. Хотя повторные вызовы не происходят в обычных ситуациях, они
могут возникать при выполнении операций ввода-вывода в обработчике
signal
. Если поток пытается повторно ввести буферизованный объект, к
которому он уже обращается, возникает RuntimeError
. Обратите внимание,
что это не запрещает другому потоку входить в буферный объект.
Вышеупомянутое неявно распространяется на текстовые файлы, поскольку функция
open()
помещает буферизованный объект в TextIOWrapper
. Это
включает стандартные потоки и, следовательно, также влияет на встроенную
функцию print()
.