Как найти количество байт в слове

Определить объём текста

Онлайн калькулятор легко и непринужденно вычислит объем текста в битах, байтах и килобайтах. Для перевода в другие единицы измерения данных воспользуйтесь онлайн конвертером.

Информационный вес (объем) символа текста определяется для следующих кодировок:
Unicode UTF-8
Unicode UTF-16
ASCII, ANSI, Windows-1251

Текст

Символов 0

Символов без учета пробелов 0

Уникальных символов 0

Слов 0

Слов (буквенных) 0

Уникальных слов 0

Строк 0

Абзацев 0

Предложений 0

Средняя длина слова 0

Время чтения 0 сек

Букв 0

Русских букв 0

Латинских букв 0

Гласных букв 0

Согласных букв 0

Слогов 0

Цифр 0

Чисел 0

Пробелов 0

Остальных знаков 0

Знаков препинания 0

Объем текста (Unicode UTF-8) бит 0

Объем текста (Unicode UTF-8) байт 0

Объем текста (Unicode UTF-8) килобайт 0

Объем текста (Unicode UTF-16) бит 0

Объем текста (Unicode UTF-16) байт 0

Объем текста (Unicode UTF-16) килобайт 0

Объем текста (ASCII, ANSI, Windows-1251) бит 0

Объем текста (ASCII, ANSI, Windows-1251) байт 0

Объем текста (ASCII, ANSI, Windows-1251) килобайт 0

Почему на windows сохраняя текст блокноте перенос строки занимает – 4 байта в юникоде или 2 байта в анси?
Это историческое явление, которое берёт начало с дос, последовательность OD OA (nr ) в виндовс используются чтоб был единообразный вывод на терминал независимо консоль это или принтер. Но для вывода просто на консоль достаточно только n.

В юникоде есть символы которые весят 4 байта, например эмоджи: 🙃

×

Пожалуйста напишите с чем связна такая низкая оценка:

×

Для установки калькулятора на iPhone – просто добавьте страницу
«На главный экран»

Для установки калькулятора на Android – просто добавьте страницу
«На главный экран»

Сколько байтов в слове байт?

Сколько байтов в слове бит?

А сколько это в битах?

Если считать в кодировке Unicode, где длина символа равна 2 байтам, то получаем: в слове “байт” 4 * 2 = 8 байтов (или 64 бита, так как 1 байт равен 8 битам), в слове “бит” 3 * 2 = 6 байтов (или 48 бит) .

система выбрала этот ответ лучшим

Однозначного ответа нет. Символы могут иметь размер в один байт, два и более байтов. Все определяется используемой системой кодировки символов. Например, в Unicode длина символа два байта. Тогда в первом слове восемь байт, во втором шесть байт, или 64 и 48 бит.

Михаи­л Белод­едов
[26.2K]

9 лет назад 

Как правило, текстовая информация кодируется одим из вариантов ASCII-таблицы. В этом случае для слова БАЙТ будет использовано 4 байта, для слова БИТ – 3 байта. Если пользоваться кодом Unicod, то в 2 раза больше – 8 и 6 байт.

Barte­ws
[1.4K]

5 лет назад 

В одном байте 8 бит. В обычной кодировке ANSI один символ занимает один байт. Получается в слове “бит” 3 байта или 24 бита, а в слове “байт” 4 байта или 32 бита. В других кодировках могут быть другие значения.

amarc­ord
[3.5K]

9 лет назад 

Лучше всего убедиться в чём-либо — посмотреть своими глазами.

Итак, создаём текстовый документ с расширением .txt. Смотрим свойства только что созданного файла, и видим там ноль байтов. Открываем документ, пишем там слово “байт”, документ закрываем, и смотрим в свойствах увеличение размера документа до восьми байтов. Делаем выводы.

Как узнать размер слова бит, думаю, теперь не составит труда.

Байт может иметь в своём составе не только 8 битов, но и другое их количество, например шесть, или, если угодно будет, и тридцать шесть. Современный байт из восьми битов называется октет.

terli­4eno4­ka
[75.3K]

6 лет назад 

Если мы создадим новым текстовый документ с расширением .txt, закроем и посмотрим его свойства, нам покажет, что он занимает 0 места. Теперь напишем в нем слово “бит” и сохраним его. Показывает, что он занял 3 байта, а на диске 4 КБ. Слово же “байт” занимает 4 байта, а на диске также 4 КБ.

Если исходить из того, что в одном байте 8 бит, то получится, что в этих словах соответственно 24 и 32 бит. Но тут все зависит от кодировки. К примеру, в Unicod один символ соответствует двум байтам, следовательно, тогда количество байтов и битов будет отличаться.

Alexe­yMiKh­ailov­ich
[301]

6 лет назад 

Для начала условимся, что в одном байте 8 бит, а значит если мы узнаем сколько байт в словах “байт” и “бит”, то умножив результат на 8 мы узнаем сколько в этих же словах бит. Один символ может быть записан в 2 байтах. Так как в слове “байт” 4 буквы, а значит и символа, делаем вывод в нем 2*4=8 байт или 8*8=64 бит. Тоже самое и со словом “бит”.

Smile­dimas­ik
[32K]

6 лет назад 

Начнем со слова “бит”. Я ввел его в текстовом блокноте и у меня получилось 5 байт, с этого выходит что битов в нем 45 если что.

Теперь слово “байт” и как не странно почему то показало что размер 4 байта. Так же стоит отметить, что когда я ввел эти слова, то место на диске они занимали уже не в байтах, а килобайтах.

Глоба­льный преди­ктор
[74.5K]

8 лет назад 

тут все зависит от кодировки. если мы используем для кодировки ASCII таблицу, то получается, что для слова “байт” использовано 4 байта, для слова “бит” 3 байта. если же мы для кодировки каждого символа используем юникод, то для слова “байт” будет 8 байт, для слова “бит” 6 байт.

Знаете ответ?

Как можно подсчитать сколько байт занимает определённое слово

Milenium 1000



Профи

(712),
на голосовании



8 лет назад

Голосование за лучший ответ

Ice

Мудрец

(19954)


8 лет назад

Определить в какой кодировке оно идёт, и если не в юникоде то каждый символ байт (не забываем управляющие символы), а в юникоде каждый символ уже пара байт.

Калькулятор считает, сколько байт занимает введенный текст.

Результат выдается сразу в двух кодировках: UTF-8/cp1251/KOI8/CP866 и UTF-16. В UTF-16 текст занимает в два раза больше места.

Введите текст (любой набор символов) *

Текст

Укажите символы, которые следует убрать из текста

Исключить символы

Регистр букв (для уникальных слов и букв)

Учитывать регистр букв

Выберите информацию, которую хотите получить

Задачи

* – обязательно заполнить

Обратите внимание на другие текстовые калькуляторы: https://calcon.ru/category/text/

I need to know the number of bytes in a ‘word’ in Python. The reason I need this is I have the number of words I need to read from a file; if I knew the number of bytes in a word, I can use the file.read(num_bytes) function to read the appropriate amount from the file.

How can I determine the number of bytes in a word?

thefourtheye's user avatar

thefourtheye

232k52 gold badges451 silver badges494 bronze badges

asked Aug 2, 2011 at 20:37

jlconlin's user avatar

5

You can use the platform.architecture function:

>>> import platform
>>> platform.architecture()
('64bit', '')

Pay attention to the note on the same page:

Note On Mac OS X (and perhaps other platforms), executable files may be universal files containing multiple architectures.
To get at the “64-bitness” of the current interpreter, it is more reliable to query the sys.maxsize attribute:

is_64bits = sys.maxsize > 2**32

Please keep in mind that this gives the word size with which the python interpreter was compiled. You could obtain a value of 32 on a 64bit host if python was compiled in 32bit mode.

If the file is produced by a different executable and you have access to this executable, you can use the first optional argument to the platform.architecture function:

>>> p.architecture('/path/to/executable')
('32bit', '')

answered Aug 2, 2011 at 20:40

GaretJax's user avatar

GaretJaxGaretJax

7,3311 gold badge37 silver badges47 bronze badges

0

There is no concept of ‘word’ in Python, when you read binary data from a file, you can state explicitly, how many bytes should be read at a time.

In terms of compiler and/or platform, ‘WORD’ generally determines a size of a basic data unit. And Python is independent from that kind of stuff 🙂

answered Aug 2, 2011 at 20:44

Zaur Nasibov's user avatar

Zaur NasibovZaur Nasibov

22.1k12 gold badges56 silver badges82 bronze badges

There’s no really sound definition for what a word is; except that certain archetectures call some number of bytes ‘word’ (x86 calls 2 bytes a word, PPC calls 4 bytes a word), but there’s not much significance besides this arbitrary value.

Perhaps the simplest solution is to just defer to the struct module; for instance, the format 'h' means signed short (which reasonably agrees with the intel definition of ‘word’). So you could do this:

>>> import struct
>>> f = file('.vimrc')
>>> struct.unpack('h', f.read(struct.calcsize('h')))
(8226,)
>>> 

answered Aug 2, 2011 at 20:45

SingleNegationElimination's user avatar

I need to know the number of bytes in a ‘word’ in Python. The reason I
need this is I have the number of words I need to read from a file

Then you need to ask the person who wrote the file. It has nothing to do with Python and everything to do with what the actual file format is. It’s pretty odd for a file to be defined as a sequence of words BTW. It is most probably a sequence of 16- or 32-bit integers, or else it really is words in the text sense, in which case you are really scanning the file for tokens between whatever the delimiters are.

answered Aug 3, 2011 at 0:03

user207421's user avatar

user207421user207421

305k43 gold badges303 silver badges479 bronze badges

How about something like this:

def machine_word_size():
    import sys
    num_bytes = 0
    maxint = sys.maxint
    while maxint > 0:
        maxint = maxint >> 8
        num_bytes += 1
    return num_bytes

answered Apr 17, 2013 at 6:58

Sri's user avatar

SriSri

1842 silver badges8 bronze badges

Perhaps the following might be relevant and helpful: Suppose you checking for 32-bits. See if (-1)<<31 comes back as long or not. For 32-bit, it does not, while (-1)<<32 and 1<<31 do.

answered May 21, 2017 at 22:51

David Vanderschel's user avatar

Добавить комментарий