As shown by other answers, using log10
leads to incorrect results for large n
while using len(str(...))
or manual looping leads to slow performance for large n
. Jodag’s answer provides a really good alternative which only fails for integers that will likely crash your computer, but we can do a bit better and even faster (for n
small enough that math.log2
is guaranteed to be accurate) by avoid logarithms altogether and using binary instead:
def num_digits(n: int) -> int:
assert n > 0
i = int(0.30102999566398114 * (n.bit_length() - 1)) + 1
return (10 ** i <= n) + i
Let’s break this down. First, there’s the weird n.bit_length()
. This calculates the length in binary:
assert 4 == (0b1111).bit_length()
assert 8 == (0b1011_1000).bit_length()
assert 9 == (0b1_1011_1000).bit_length()
Unlike logarithms, this is both fast and precise for integers. As it turns out, this results in exactly floor(log2(n)) + 1
. In order to get the floor(log2(n))
on its own, we subtract 1
, hence the n.bit_length() - 1
.
Next, we multiply by 0.30102999566398114
. This is equivalent to log10(2)
slightly rounded down. This takes advantage of logarithmic rules in order to calculate an estimate of floor(log10(n))
from floor(log2(n))
.
Now, you might be wondering how off we might be at this point, because although 0.30102999566398114 * log2(n) ~ log10(n)
, the same is not true for floor(0.30102999566398114 * floor(log2(n))) ~ floor(log10(n))
. Recall that x - 1 < floor(x) <= x
so that we can do some quick math:
log2(n) - 1 < floor(log2(n)) <= log2(n)
log10(n) - 0.30102999566398114 < 0.30102999566398114 * floor(log2(n)) <= log10(n)
floor(log10(n) - 0.30102999566398114) < floor(0.30102999566398114 * floor(log2(n))) <= floor(log10(n))
Note then that floor(log10(n) - 0.30102999566398114)
is at least floor(log10(n)) - 1
, meaning we are at most 1
off from our result. This is where the final correction comes in, where we check 10 ** i <= n
, which results in an extra 1 +
when the result is too small or 0 +
when the result is just right.
Similar to Jodag’s answer, this approach actually fails for very very large n
, somewhere around 10 ** 2 ** 52
where i
is off by more than -1
. However, integers of that size will likely crash your computer, so this should suffice.
Watch Now This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Python’s len() Function
In many situations, you’ll need to find the number of items stored in a data structure. Python’s built-in function len()
is the tool that will help you with this task.
There are some cases in which the use of len()
is straightforward. However, there are other times when you’ll need to understand how this function works in more detail and how to apply it to different data types.
In this tutorial, you’ll learn how to:
- Find the length of built-in data types using
len()
- Use
len()
with third-party data types - Provide support for
len()
with user-defined classes
By the end of this article, you’ll know when to use the len()
Python function and how to use it effectively. You’ll know which built-in data types are valid arguments for len()
and which ones you can’t use. You’ll also understand how to use len()
with third-party types, such as ndarray
in NumPy and DataFrame
in pandas, and with your own classes.
Getting Started With Python’s len()
The function len()
is one of Python’s built-in functions. It returns the length of an object. For example, it can return the number of items in a list. You can use the function with many different data types. However, not all data types are valid arguments for len()
.
You can start by looking at the help for this function:
>>>
>>> help(len)
Help on built-in function len in module builtins:
len(obj, /)
Return the number of items in a container.
The function takes an object as an argument and returns the length of that object. The documentation for len()
goes a bit further:
Return the length (the number of items) of an object. The argument may be a sequence (such as a string, bytes, tuple, list, or range) or a collection (such as a dictionary, set, or frozen set). (Source)
When you use built-in data types and many third-party types with len()
, the function doesn’t need to iterate through the data structure. The length of a container object is stored as an attribute of the object. The value of this attribute is modified each time items are added to or removed from the data structure, and len()
returns the value of the length attribute. This ensures that len()
works efficiently.
In the following sections, you’ll learn about how to use len()
with sequences and collections. You’ll also learn about some data types that you cannot use as arguments for the len()
Python function.
Using len()
With Built-in Sequences
A sequence is a container with ordered items. Lists, tuples, and strings are three of the basic built-in sequences in Python. You can find the length of a sequence by calling len()
:
>>>
>>> greeting = "Good Day!"
>>> len(greeting)
9
>>> office_days = ["Tuesday", "Thursday", "Friday"]
>>> len(office_days)
3
>>> london_coordinates = (51.50722, -0.1275)
>>> len(london_coordinates)
2
When finding the length of the string greeting
, the list office_days
, and the tuple london_coordinates
, you use len()
in the same manner. All three data types are valid arguments for len()
.
The function len()
always returns an integer as it’s counting the number of items in the object that you pass to it. The function returns 0
if the argument is an empty sequence:
>>>
>>> len("")
0
>>> len([])
0
>>> len(())
0
In the examples above, you find the length of an empty string, an empty list, and an empty tuple. The function returns 0
in each case.
A range
object is also a sequence that you can create using range()
. A range
object doesn’t store all the values but generates them when they’re needed. However, you can still find the length of a range
object using len()
:
>>>
>>> len(range(1, 20, 2))
10
This range of numbers includes the integers from 1
to 19
with increments of 2
. The length of a range
object can be determined from the start, stop, and step values.
In this section, you’ve used the len()
Python function with strings, lists, tuples, and range
objects. However, you can also use the function with any other built-in sequence.
Using len()
With Built-in Collections
At some point, you may need to find the number of unique items in a list or another sequence. You can use sets and len()
to achieve this:
>>>
>>> import random
>>> numbers = [random.randint(1, 20) for _ in range(20)]
>>> numbers
[3, 8, 19, 1, 17, 14, 6, 19, 14, 7, 6, 1, 17, 10, 8, 14, 17, 10, 2, 5]
>>> unique_numbers = set(numbers)
{1, 2, 3, 5, 6, 7, 8, 10, 14, 17, 19}
>>> len(unique_numbers)
11
You generate the list numbers
using a list comprehension, and it contains twenty random numbers ranging between 1
and 20
. The output will be different each time the code runs since you’re generating random numbers. In this particular run, there are eleven unique numbers in the list of twenty randomly generated numbers.
Another built-in data type that you’ll use often is the dictionary. In a dictionary, each item consists of a key-value pair. When you use a dictionary as an argument for len()
, the function returns the number of items in the dictionary:
>>>
>>> len({"James": 10, "Mary": 12, "Robert": 11})
3
>>> len({})
0
The output from the first example shows that there are three key-value pairs in this dictionary. As was the case with sequences, len()
will return 0
when the argument is either an empty dictionary or an empty set. This leads to empty dictionaries and empty sets being falsy.
Exploring len()
With Other Built-in Data Types
You can’t use all built-in data types as arguments for len()
. For data types that don’t store more than one item within them, the concept of length isn’t relevant. This is the case with numbers and Boolean types:
>>>
>>> len(5)
Traceback (most recent call last):
...
TypeError: object of type 'int' has no len()
>>> len(5.5)
Traceback (most recent call last):
...
TypeError: object of type 'float' has no len()
>>> len(True)
Traceback (most recent call last):
...
TypeError: object of type 'bool' has no len()
>>> len(5 + 2j)
Traceback (most recent call last):
...
TypeError: object of type 'complex' has no len()
The integer, float, Boolean, and complex types are examples of built-in data types that you can’t use with len()
. The function raises a TypeError
when the argument is an object of a data type that doesn’t have a length.
You can also explore whether it’s possible to use iterators and generators as arguments for len()
:
>>>
>>> import random
>>> numbers = [random.randint(1, 20) for _ in range(20)]
>>> len(numbers)
20
>>> numbers_iterator = iter(numbers)
>>> len(numbers_iterator)
Traceback (most recent call last):
...
TypeError: object of type 'list_iterator' has no len()
>>> numbers_generator = (random.randint(1, 20) for _ in range(20))
>>> len(numbers_generator)
Traceback (most recent call last):
...
TypeError: object of type 'generator' has no len()
You’ve already seen that a list has a length, meaning you can use it as an argument in len()
. You create an iterator from the list using the built-in function iter()
. In an iterator, each item is fetched whenever it’s required, such as when the function next()
is used or in a loop. However, you can’t use an iterator in len()
.
You get a TypeError
when you try to use an iterator as an argument for len()
. As the iterator fetches each item as and when it’s needed, the only way to measure its length is to exhaust the iterator. An iterator can also be infinite, such as the iterator returned by itertools.cycle()
, and therefore its length can’t be defined.
You can’t use generators with len()
for the same reason. The length of these objects can’t be measured without using them up.
Exploring len()
Further With Some Examples
In this section, you’ll learn about some common use cases for len()
. These examples will help you understand better when to use this function and how to use it effectively. In some of the examples, you’ll also see cases where len()
is a possible solution but there may be more Pythonic ways of achieving the same output.
Verifying the Length of a User Input
A common use case of len()
is to verify the length of a sequence input by a user:
# username.py
username = input("Choose a username: [4-10 characters] ")
if 4 <= len(username) <= 10:
print(f"Thank you. The username {username} is valid")
else:
print("The username must be between 4 and 10 characters long")
In this example, you use an if
statement to check if the integer returned by len()
is greater than or equal to 4
and less than or equal to 10
. You can run this script and you’ll get an output similar to the one below:
$ python username.py
Choose a username: [4-10 characters] stephen_g
Thank you. The username stephen_g is valid
The username is nine characters long in this case, so the condition in the if
statement evaluates to True
. You can run the script again and input an invalid username:
$ python username.py
Choose a username: [4-10 characters] sg
The username must be between 4 and 10 characters long
In this case, len(username)
returns 2
, and the condition in the if
statement evaluates to False
.
Ending a Loop Based on the Length of an Object
You’ll use len()
if you need to check when the length of a mutable sequence, such as a list, reaches a specific number. In the following example, you ask the user to enter three username options, which you store in a list:
# username.py
usernames = []
print("Enter three options for your username")
while len(usernames) < 3:
username = input("Choose a username: [4-10 characters] ")
if 4 <= len(username) <= 10:
print(f"Thank you. The username {username} is valid")
usernames.append(username)
else:
print("The username must be between 4 and 10 characters long")
print(usernames)
You’re now using the result from len()
in the while
statement. If the user enters an invalid username, you don’t keep the input. When the user enters a valid string, you append it to the list usernames
. The loop repeats until there are three items in the list.
You could even use len()
to check when a sequence is empty:
>>>
>>> colors = ["red", "green", "blue", "yellow", "pink"]
>>> while len(colors) > 0:
... print(f"The next color is {colors.pop(0)}")
...
The next color is red
The next color is green
The next color is blue
The next color is yellow
The next color is pink
You use the list method .pop()
to remove the first item from the list in each iteration until the list is empty. If you’re using this method on large lists, you should remove items from the end of the list as this is more efficient. You can also use the deque data type from the collections
built-in module, which allows you to pop from the left efficiently.
There’s a more Pythonic way of achieving the same output by using the truthiness of sequences:
>>>
>>> colors = ["red", "green", "blue", "yellow", "pink"]
>>> while colors:
... print(f"The next color is {colors.pop(0)}")
...
The next color is red
The next color is green
The next color is blue
The next color is yellow
The next color is pink
An empty list is falsy. This means that the while
statement interprets an empty list as False
. A non-empty list is truthy, and the while
statement treats it as True
. The value returned by len()
determines the truthiness of a sequence. A sequence is truthy when len()
returns any non-zero integer and falsy when len()
returns 0
.
Finding the Index of the Last Item of a Sequence
Imagine you want to generate a sequence of random numbers in the range 1
to 10
and you’d like to keep adding numbers to the sequence until the sum of all the numbers exceeds 21
. The following code creates an empty list and uses a while
loop to populate the list:
>>>
>>> import random
>>> numbers = []
>>> while sum(numbers) <= 21:
... numbers.append(random.randint(1, 10))
>>> numbers
[3, 10, 4, 7]
>>> numbers[len(numbers) - 1]
7
>>> numbers[-1] # A more Pythonic way to retrieve the last item
7
>>> numbers.pop(len(numbers) - 1) # You can use numbers.pop(-1)
7
>>> numbers
[3, 10, 4]
You append random numbers to the list until the sum exceeds 21
. The output you’ll get will vary as you’re generating random numbers. To display the last number in the list, you use len(numbers)
and subtract 1
from it since the first index of the list is 0
. Indexing in Python allows you to use the index -1
to obtain the last item in a list. Therefore, although you can use len()
in this case, you don’t need to.
You want to remove the last number in the list so that the sum of all numbers in the list doesn’t exceed 21
. You use len()
again to work out the index of the last item in the list, which you use as an argument for the list method .pop()
. Even in this instance, you could use -1
as an argument for .pop()
to remove the last item from the list and return it.
Splitting a List Into Two Halves
If you need to split a sequence into two halves, you’ll need to use the index that represents the midpoint of the sequence. You can use len()
to find this value. In the following example, you’ll create a list of random numbers and then split it into two smaller lists:
>>>
>>> import random
>>> numbers = [random.randint(1, 10) for _ in range(10)]
>>> numbers
[9, 1, 1, 2, 8, 10, 8, 6, 8, 5]
>>> first_half = numbers[: len(numbers) // 2]
>>> second_half = numbers[len(numbers) // 2 :]
>>> first_half
[9, 1, 1, 2, 8]
>>> second_half
[10, 8, 6, 8, 5]
In the assignment statement where you define first_half
, you use the slice that represents the items from the beginning of numbers
up to the midpoint. You can work out what the slice represents by breaking down the steps you use in the slice expression:
- First,
len(numbers)
returns the integer10
. - Next,
10 // 2
returns the integer5
as you use the integer division operator. - Finally,
0:5
is a slice that represents the first five items, which have indices0
to4
. Note that the endpoint is excluded.
In the next assignment, where you define second_half
, you use the same expression in the slice. However, in this case, the integer 5
represents the start of the range. The slice is now 5:
to represent the items from index 5
up to the end of the list.
If your original list contains an odd number of items, then half of its length will no longer be a whole number. When you use integer division, you obtain the floor of the number. The list first_half
will now contain one less item than second_half
.
You can try this out by creating an initial list of eleven numbers instead of ten. The resulting lists will no longer be halves, but they’ll represent the closest alternative to splitting an odd sequence.
Using the len()
Function With Third-Party Libraries
You can also use Python’s len()
with several custom data types from third-party libraries. In the last section of this tutorial, you’ll learn how the behavior of len()
depends on the class definition. In this section, you’ll look at examples of using len()
with data types from two popular third-party libraries.
NumPy’s ndarray
The NumPy module is the cornerstone of all quantitative applications of programming in Python. The module introduces the numpy.ndarray
data type. This data type, along with functions within NumPy, is ideally suited for numerical computations and is the building block for data types in other modules.
Before you can start using NumPy, you’ll need to install the library. You can use Python’s standard package manager, pip
, and run the following command in the console:
$ python -m pip install numpy
You’ve installed NumPy, and now you can create a NumPy array from a list and use len()
on the array:
>>>
>>> import numpy as np
>>> numbers = np.array([4, 7, 9, 23, 10, 6])
>>> type(numbers)
<class 'numpy.ndarray'>
>>> len(numbers)
6
The NumPy function np.array()
creates an object of type numpy.ndarray
from the list you pass as an argument.
However, NumPy arrays can have more than one dimension. You can create a two-dimensional array by converting a list of lists into an array:
>>>
>>> import numpy as np
>>> numbers = [
[11, 1, 10, 10, 15],
[14, 9, 16, 4, 4],
]
>>> numbers_array = np.array(numbers)
>>> numbers_array
array([[11, 1, 10, 10, 15],
[14, 9, 16, 4, 4]])
>>> len(numbers_array)
2
>>> numbers_array.shape
(2, 5)
>>> len(numbers_array.shape)
2
>>> numbers_array.ndim
2
The list numbers
consists of two lists, each containing five integers. When you use this list of lists to create a NumPy array, the result is an array with two rows and five columns. The function returns the number of rows in the array when you pass this two-dimensional array as an argument in len()
.
To get the size of both dimensions, you use the property .shape
, which is a tuple showing the number of rows and columns. You obtain the number of dimensions of a NumPy array either by using .shape
and len()
or by using the property .ndim
.
In general, when you have an array with any number of dimensions, len()
returns the size of the first dimension:
>>>
>>> import numpy as np
>>> array_3d = np.random.randint(1, 20, [2, 3, 4])
>>> array_3d
array([[[14, 9, 15, 14],
[17, 11, 10, 5],
[18, 1, 3, 12]],
[[ 1, 5, 6, 10],
[ 6, 3, 1, 12],
[ 1, 4, 4, 17]]])
>>> array_3d.shape
(2, 3, 4)
>>> len(array_3d)
2
In this example, you create a three-dimensional array with the shape (2, 3, 4)
where each element is a random integer between 1
and 20
. You use the function np.random.randint()
to create an array this time. The function len()
returns 2
, which is the size of the first dimension.
Check out NumPy Tutorial: Your First Steps Into Data Science in Python to learn more about using NumPy arrays.
Pandas’ DataFrame
The DataFrame
type in the pandas library is another data type that is used extensively in many applications.
Before you can use pandas, you’ll need to install it by using the following command in the console:
$ python -m pip install pandas
You’ve installed the pandas package, and now you can create a DataFrame from a dictionary:
>>>
>>> import pandas as pd
>>> marks = {
"Robert": [60, 75, 90],
"Mary": [78, 55, 87],
"Kate": [47, 96, 85],
"John": [68, 88, 69],
}
>>> marks_df = pd.DataFrame(marks, index=["Physics", "Math", "English"])
>>> marks_df
Robert Mary Kate John
Physics 60 78 47 68
Math 75 55 96 88
English 90 87 85 69
>>> len(marks_df)
3
>>> marks_df.shape
(3, 4)
The dictionary’s keys are strings representing the names of students in a class. The value of each key is a list with the marks for three subjects. When you create a DataFrame from this dictionary, you define the index using a list containing the subject names.
The DataFrame has three rows and four columns. The function len()
returns the number of rows in the DataFrame. The DataFrame
type also has a .shape
property, which you can use to show that the first dimension of a DataFrame represents the number of rows.
You’ve seen how len()
works with a number of built-in data types and also with some data types from third-party modules. In the following section, you’ll learn how to define any class so that it’s usable as an argument for the len()
Python function.
You can explore the pandas module further in The Pandas DataFrame: Make Working With Data Delightful.
Using len()
on User-Defined Classes
When you define a class, one of the special methods you can define is .__len__()
. These special methods are called dunder methods as they have double underscores at the beginning and end of the method names. Python’s built-in len()
function calls its argument’s .__len__()
method.
In the previous section, you’ve seen how len()
behaves when the argument is a pandas DataFrame
object. This behavior is determined by the .__len__()
method for the DataFrame
class, which you can see in the module’s source code in pandas.core.frame
:
class DataFrame(NDFrame, OpsMixin):
# ...
def __len__(self) -> int:
"""
Returns length of info axis, but here we use the index.
"""
return len(self.index)
This method returns the length of the DataFrame’s .index
property using len()
. This dunder method defines the length of a DataFrame to be equal to the number of rows in the DataFrame as represented by .index
.
You can explore the .__len__()
dunder method further with the following toy example. You’ll define a class named YString
. This data type is based on the built-in string class, but objects of type YString
give the letter Y more importance than all the other letters:
# ystring.py
class YString(str):
def __init__(self, text):
super().__init__()
def __str__(self):
"""Display string as lowercase except for Ys that are uppercase"""
return self.lower().replace("y", "Y")
def __len__(self):
"""Returns the number of Ys in the string"""
return self.lower().count("y")
The .__init__()
method of YString
initializes the object using the .__init__()
method of the parent str
class. You achieve this using the function super()
. The .__str__()
method defines the way the object is displayed. The functions str()
, print()
, and format()
all call this method. For this class, you represent the object as an all-lowercase string with the exception of the letter Y, which you display as uppercase.
For this toy class, you define the object’s length as the number of occurrences of the letter Y in the string. Therefore, the .__len__()
method returns the count of the letter Y.
You can create an object of class YString
and find its length. The module name used for the example above is ystring.py
:
>>>
>>> from ystring import YString
>>> message = YString("Real Python? Yes! Start reading today to learn Python")
>>> print(message)
real pYthon? Yes! start reading todaY to learn pYthon
>>> len(message) # Returns number of Ys in message
4
You create an object of type YString
from an object of type str
and show the representation of the object using print()
. You then use the object message
as an argument for len()
. This calls the class’s .__len__()
method, and the result is the number of occurrences of the letter Y in message
. In this case, the letter Y appears four times.
The YString
class is not a very useful one, but it helps illustrate how you can customize the behavior of len()
to suit your needs. The .__len__()
method must return a non-negative integer. Otherwise, it raises an error.
Another special method is the .__bool__()
method, which determines how an object can be converted to a Boolean. The .__bool__()
dunder method is not normally defined for sequences and collections. In these cases, the .__len__()
method determines the truthiness of an object:
>>>
>>> from ystring import YString
>>> first_test = "tomorrow"
>>> second_test = "today"
>>> bool(first_test)
True
>>> bool(YString(first_test))
False
>>> bool(second_test)
True
>>> bool(YString(second_test))
True
The variable first_string
doesn’t have a Y in it. As shown by the output from bool()
, the string is truthy as it’s non-empty. However, when you create an object of type YString
from this string, the new object is falsy as there are no Y letters in the string. Therefore, len()
returns 0
. In contrast, the variable second_string
does include the letter Y, and so both the string and the object of type YString
are truthy.
You can read more about using object-oriented programming and defining classes in Object-Oriented Programming (OOP) in Python 3.
Conclusion
You’ve explored how to use len()
to determine the number of items in sequences, collections, and other data types that hold several items at a time, such as NumPy arrays and pandas DataFrames.
The len()
Python function is a key tool in many programs. Some of its uses are straightforward, but there’s a lot more to this function than its most basic use cases, as you’ve seen in this tutorial. Knowing when you can use this function and how to use it effectively will help you write neater code.
In this tutorial, you’ve learned how to:
- Find the length of built-in data types using
len()
- Use
len()
with third-party data types - Provide support for
len()
with user-defined classes
You now have a good foundation for understanding the len()
function. Learning more about len()
helps you understand the differences between data types better. You’re ready to use len()
in your algorithms and to improve the functionality of some of your class definitions by enhancing them with the .__len__()
method.
Watch Now This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Python’s len() Function
Функция len() в Python принимает объект в качестве аргумента и возвращает длину этого объекта. Например, функция len() может возвращать количество элементов в списке.
Синтаксис функции len() имеет следующий вид:
len(object)
Функция len()
принимает один аргумент, который может быть:
- последовательностью — строки, байтовые строки, итерируемые последовательности типа списка или кортежа;
- коллекцией — словари, множества, замороженные множества и так далее.
А возвращает len()
количество элементов в объекте, который передан в качестве аргумента.
Если мы не передаем никакого аргумента или аргумент имеет недопустимый тип, это вызовет исключение TypeError
.
Ошибка TypeError возникает, когда тип данных не является коллекцией или последовательностью. Например, логическое значение, int и т. д.
Например:
print(len(False)) print(len(1212))
Результат:
TypeError: object of type 'bool' has no len() TypeError: object of type 'int' has no len()
Давайте найдем количество элементов внутри списка, иными словами — длину списка.
fruits = ['Bananas', 'Apples', 'Mangoes'] # вычисляем длину списка фруктов l = len(fruits) # выводим длину списка на экран print(l) # Результат: # 3
Что собой представляет функция len() в Python?
len()
— это встроенная функция Python, которая принимает объект в качестве аргумента и возвращает его длину. Например, она может возвращать количество элементов в списке Python.
help(len)
Результат:
Help on built-in function len in module builtins: len(obj, /) Return the number of items in an object.
Всякий раз, когда мы используем встроенные и внешние типы данных с функцией len()
, она не производит итерацию по структуре данных. Длина объекта-контейнера хранится как атрибут данного объекта. Значение этого атрибута изменяется каждый раз, когда элементы добавляются или удаляются из структуры данных, и len()
просто возвращает данное значение. Это гарантирует, что функция len() работает быстро и эффективно.
Как применяется функция len()
Использование функции len() со встроенными последовательностями
Последовательность — это объект, содержащий элементы в упорядоченном виде. Списки, кортежи и строки являются основными примерами встроенных последовательностей в Python, а функция len() используется для вычисления длин этих последовательностей.
# Строка с именем name = "Andrew" print(len(name)) # 6 # Список продуктов food_items = ["Pizza", "Burger", "French Fries"] print(len(food_items)) # 3 # Кортеж с координатами coordinates = (51, 24) print(len(coordinates)) # 2 # Пустая строка print(len("")) # 0 # Пустой список print(len([])) # 0 # Пустой кортеж print(len()) # 0
Объяснение кода:
В приведенном выше фрагменте кода, чтобы найти длину строки name
, списка food_items
и кортежа coordinates
, мы используем len()
. Все эти три типа данных являются допустимыми аргументами для функции len()
. Данная функция возвращает целое число, так как подсчитывает количество элементов в объекте, который передается ей в качестве аргумента. Если аргумент является пустой последовательностью, функция len()
возвращает 0
.
Для создания последовательностей в определенном диапазоне мы также можем использовать функцию range()
. Данная функция не хранит свои значения, а генерирует их по мере необходимости. Однако мы можем найти длину такой последовательности при помощи функции len()
.
print(len(range(1, 10))) # Результат: # 9
Объяснение кода:
Этот диапазон чисел включает целые числа от 1 до 9 (10 исключается). Мы можем задавать длину объекта функции range()
, используя ее аргументы start
, stop
и step
.
Использование функции len() со встроенными коллекциями
Коллекции в Python — это типы данных, построенные на базе контейнеров. Это списки, множества, кортежи и словари. Все коллекции имеют определенные характеристики, основанные на их объявлении и использовании в программе. Например, списки объявляются в квадратных скобках. Они изменяемы, хранят повторяющиеся значения, а к их элементам можно обращаться при помощи индексов.
Пример 1. Определение длины коллекции, сгенерированной при помощи модуля random
В данном примере мы сначала используем функцию randint
модуля random
для создания списка случайных целых чисел, а затем применим функцию len()
, чтобы найти количество элементов в коллекции.
import random # Создаем список из 10 случайных чисел nums = [random.randint(1, 10) for _ in range(10)] print(nums) # Создаем множество, которое содержит только уникальные элементы списка unique = set(nums) # Выводим на экран множество и его длину print(unique) print(len(unique))
Результат:
[9, 1, 8, 6, 8, 8, 1, 9, 3, 10] {1, 3, 6, 8, 9, 10} 6
Объяснение кода:
В приведенной выше программе мы сгенерировали список из 10 случайных чисел в диапазоне от 1 до 10, используя представление списков. Результат будет отличаться при каждом новом запуске кода, поскольку мы генерируем случайные числа. В данном случае множество содержит 6 уникальных чисел.
Пример 2. Определение количества элементов в словаре
Словарь — это встроенный тип данных в Python, который используется для хранения элементов в виде пар ключ-значение. Когда мы используем словарь в качестве аргумента для len()
, функция возвращает количество элементов (пар ключ-значение) в словаре.
# Словарь, содержащий продукты питания print(len({"Potato": 10, "Onion": 12, "Tomato": 11})) # Пустой словарь print(len({})) # Результат: # 3 # 0
Объяснение кода:
В выводе первым мы получили число 3
. Это означает, что в словаре с продуктами есть три пары ключ-значение. Как и в случае с последовательностями, функция len()
возвращает 0
, если аргументом является либо пустой словарь, либо пустое множество.
Использование функции len() с другими встроенными типами данных
Типы данных, которые не хранят в себе более одного элемента, не могут использоваться в качестве аргумента для функции len()
.
print(len(False)) print(len(1))
Результат:
TypeError: object of type 'bool' has no len() TypeError: object of type 'int' has no len()
Целочисленные, вещественные, логические и сложные типы являются примерами встроенных типов данных, которые нельзя использовать с функцией len()
. Функция вызывает TypeError, когда в нее передается аргумент недопустимого типа данных.
Использование функции len() со сторонними библиотеками
Мы также можем использовать функцию len()
для объектов из различных сторонних библиотек. В этом разделе мы рассмотрим примеры использования len()
с типами данных из двух популярных библиотек — NumPy и pandas.
Пример 1. Использование функции len() с массивом NumPy
Библиотека NumPy используется для выполнения ресурсоемких задач и является строительным блоком для различных типов данных.
Применив функцию NumPy np.array(), мы можем создать объект типа <np.ndarray>
, используя переданный в качестве аргумента список.
import numpy as np nums = np.array([1, 7, 11, 2, 9, 25]) print(type(nums)) print(len(nums)) # Результат: # <class 'numpy.ndarray'> # 6
Объяснение кода:
Мы создали одномерный массив длины 6
, используя функцию np.array()
, и вычислили его тип и длину, используя функции type()
и len()
соответственно.
Пример 2. Использование функции len() с Pandas DataFrame
Pandas DataFrame — это двумерная структура данных с помеченными осями (строками и столбцами). Данные внутри Pandas DataFrame выровнены табличным образом по строкам и столбцам. Датафреймы (DataFrame) широко используются в машинном обучении, научных вычислениях и многих других областях, связанных с интенсивным использованием данных.
import pandas as pd # Создаем словарь marks = { "Ash": [60, 75, 90], "Gary": [78, 55, 87], "Max": [47, 96, 85], "Tyson": [68, 88, 69], } # Создаем из словаря датафрейм df = pd.DataFrame(marks, index=["Maths", "Physics", "Chemistry"]) print(df) # Выводим на экран длину датафрейма print(len(df)) # Выводим на экран размеры датафрейма print(df.shape)
Результат:
Ash Gary Max Tyson Maths 60 78 47 68 Physics 75 55 96 88 Chemistry 90 87 85 69 3 (3, 4)
Объяснение кода:
Ключи нашего словаря, содержащего отметки, представляют собой строки, являющиеся именами студентов. Значение каждого ключа представляет собой список, в котором хранятся оценки по трем предметам: математике, физике и химии.
При создании датафрейма с использованием этого словаря в качестве аргумента в функции pd.DataFrame()
мы также должны определить индекс, используя список, содержащий три учебных предмета.
Созданный датафрейм содержит три строки и четыре столбца. Функция len()
возвращает количество строк в датафрейме. Pandas DataFrame имеет свойство .shape
, которое можно использовать для вывода количества строк и столбцов датафрейма в кортеже из двух элементов.
Использование функции len() в пользовательских классах
Встроенная в Python функция len()
вызывает в нашем классе метод с именем __len__()
. Такие методы, имеющие двойное подчеркивание в начале и конце имени, называются магическими.
Реализация этого метода позволит вызову len()
работать с нашим классом. Если данный метод не будет реализован, вызов функции len()
завершится ошибкой AttributeError. Встроенная в Python функция len()
вызывает метод .__len__()
своего аргумента.
class Order: def __init__(self, count): self.count = count def __len__(self): return self.count myOrder = Order(7) print(len(myOrder)) # Результат: # 7
Объяснение кода:
В вышеприведенной программе есть класс Order
с атрибутом count
. Мы также реализовали магическую функцию __len__()
, которая возвращает общее количество заказов, переданных ей в качестве аргумента. Далее мы создали экземпляр нашего класса с именем myOrder
, передав в него аргумент count
, равный семи. И при вызове функции len() было возвращено значение данного атрибута.
Заключение
В данной статье мы рассмотрели, как использовать функцию len() в Python для определения количества элементов в последовательностях, коллекциях и сторонних типах данных.
Функция len() принимает объект в качестве аргумента и возвращает длину этого объекта.
Функцию len() можно использовать для:
- встроенных типов данных;
- типов данных из сторонних библиотек (например Numpy или pandas);
- заданных пользователем классов (для этого в классе необходимо реализовать магический метод
__len__()
);
Перевод статьи «len() Function in Python».
Количество элементов в последовательности или коллекции.
Синтаксис:
Параметры:
s
– последовательность или коллекция.
Возвращаемое значение:
- целое число.
Описание:
Функция len()
возвращает длину (количество элементов) в объекте.
Аргумент может быть последовательностью, такой как строка, байты, кортеж, список или диапазон или коллекцией (такой как словарь, множество или неизменяемое множество).
Когда объект является строкой, функция
len()
возвращает количество символов в строке (строка представляет собой частный случай кортежа Python).
Пользовательские типы данных могут определять метод __len__()
, значение из которого, будет возвращено при вызове функции len()
.
Примечание. Встроенная функция
len()
НЕ РАБОТАЕТ с итераторами и генераторами.
Примеры подсчета количества элементов в последовательности.
Что можно подсчитать:
- число элементов в списке;
- число элементов в кортеже;
- число символов в строке (длина строки);
- количество байтов в строке;
- число элементов в множестве;
- число пар ключ-значение в словаре;
Подсчет элементов списка.
# подсчет количества элементов списка >>> mylist = ['apple', 'banana', 'cherry'] >>> len(mylist) # 3
Подсчет количества символов в строке (длина строки).
# подсчет символов в строке >>> string = 'Hello' >>> len(string) # 5 >>> len('абракадабра') # 11
Подсчет количества байтов в строке.
# подсчет символов в строке >>> line_en = 'Hello'.encode('utf-8') >>> line_ru = 'Привет'.encode('utf-8') >>> len(line_en) # 5 >>> len(line_ru) # 12
Подсчет количества ключей словаря.
# подсчет количества ключей словаря. >>> d = {'a': 1, 'b': 1, 'c': 1, 'd': 1} >>> keys = list(d) >>> len(keys) # 4
Другие паттерны использования функции len()
.
Проверка списка на дублирующие значения:
Чтобы проверить уникальность значений списка достаточно сравнить количество элементов списка с количеством элементов множества этого списка. Используя тот факт, что множество set()
содержит только уникальные элементы.
>>> lst = [1, 2, 3, 4, 5, 6] # список с уникальными значениями >>> len(lst) == len(set(lst)) # True >>> lst.append(3) >>> lst # [1, 2, 3, 4, 5, 6, 3] # в списке есть повторы >>> len(lst) == len(set(lst)) # False
Использование функции len()
для подчеркивания строки:
>>> mystr = "Привет Python!" >>> underline = '-' * len(mystr) >>> print(f'{mystr}n{underline}') # Привет Python! # --------------
Использование функции len()
в итерации по индексам последовательности:
Это пример – как один из вариантов получения индексов элементов списка. Конечно, для этой цели лучше использовать встроенную функцию enumerate()
, т.к. сразу можно получить и индекс элемента и его значение.
>>> mylist = ['apple', 'banana', 'cherry', 'pear', 'plum'] >>> for i in range(len(mylist)): ... print(i, mylist[i]) ... # 0 apple # 1 banana # 2 cherry # 3 pear # 4 plum
Использование встроенной функции enumerate()
для получения индексов элементов:
>>> mylist = ['apple', 'banana', 'cherry', 'pear', 'plum'] >>> for i, item in enumerate(mylist): ... print(i, item) ... # 0 apple # 1 banana # 2 cherry # 3 pear # 4 plum
По индексам последовательности, конечно удобнее итерироваться при помощи функции enumerate()
.
Подсчет количества цифр в числе (длина числа)
Для того, чтобы посчитать количество цифр в числе необходимо сначала перевести число float
или int
в любую последовательность, например в строку, а затем к последовательности применить функцию len()
, что бы получить количество элементов.
Для получения строкового представления объектов float
и int
, применим к ним функцию str.
Пример получения длины целого числа:
# получение длины целого числа >>> x = 1235412687 >>> str_x = str(x) >>> str_x # '1235412687' >>> num_x = len(str_x) >>> num_x # 10
Так как вещественные числа в Python имеют запятую, то количество цифр в числе float
будет на 1 меньше, а именно len(str(float)) - 1
.
Пример получения длины вещественного числа:
# получение длины вещественного числа >>> x = 0.1230541287 # запишем преобразования короче >>> num_x = len(str(x)) - 1 >>> num_x # 11
Чтобы получить количество уникальных цифр в числе, необходимо строковое представление числа преобразовать в множество set
, т.к. множество представляет собой последовательность неповторяющихся элементов.
Пример подсчета уникальных цифр в числах float
и int
:
# получение кол-ва уникальных цифр целого числа >>> x = 1235412687 # получаем строковое представление >>> str_x = str(x) # получаем множество уникальных цифр числа >>> set_x = set(str_x) # {'1', '5', '7', '8', '6', '2', '4', '3'} # считаем кол-во уникальных цифр >>> num_x = len(set_x) >>> num_x # 8 # для получения кол-ва уникальных цифр # числа `float` сделаем запись короче >>> x = 0.1230541287 # количество уникальных цифр числа `float` # будет на 1 меньше, т.к. число имеет разделитель >>> num_x = len(set(str(x))) - 1 # 8
Cоздайте Python функцию, которая принимает на вход число num и используя только математические и логические операции (без использования функции len()), вычисляет и возвращает количество цифр в этом числе.
Примеры:
number_length(19) # 2
number_length(4840) # 4
number_length(0) # 1
Примечания:
Использование функции len() запрещено.
Варианты решения:
def number_length(num):
if num == 0:
return 1
length = 0
num = abs(num)
while num > 0:
num //= 10
length += 1
return length
В этом решении, мы используем цикл while для итерации по цифрам числа. На каждой итерации цикла, мы удаляем последнюю цифру числа, используя операцию целочисленного деления (//) на 10. Поскольку мы удаляем одну цифру на каждой итерации, то количество итераций равно количеству цифр в числе.
P.S.
abs()
в Python это функция, которая возвращает абсолютное значение числа (модуль числа). Например abs(-5) вернет 5, abs(5) вернет 5.
Еще один вариант решения может быть использование математического метода log10, чтобы определить длину числа как количество цифр в нем.
import math
def number_length(num):
if num == 0:
return 1
num = abs(num)
return math.floor(math.log10(num)) + 1
math.log10(x)
– это функция из модуля math
в Python, которая возвращает десятичный логарифм числа x
. Логарифм числа x по основанию 10 – это такое значение y, для которого 10 ** y = x (10 в степени y равно x).
math.floor(x)
это функция которая округляет значение в меньшую сторону, например: math.floor(4.9) = 4
В данном случае мы используем его чтобы округлить десятичный логарифм числа в меньшую сторону, потому что длина числа не может быть дробной.
Также можно решить задачу с помощью рекурсии. Но это может быть не самым оптимальным решением и может привести к переполнению стека если число будет большим.
def number_length(num):
if num == 0:
return 1
return 1 + number_length(num // 10)
В этом решении мы рекурсивно вызываем функцию number_length с числом, деленным на 10 на каждом шаге рекурсии, таким образом каждый раз удаляя последнюю цифру числа. Количество рекурсивных вызовов равно количеству цифр в числе, поэтому мы можем просто возвращать 1 + результат рекурсивного вызова функции.