как узнать количество строк в dataframe pandas
Подсчет и фильтрация строк в DataFrame Pandas
Чтобы подсчитать количество строк в DataFrame, вы можете использовать свойство shape или метод count().
DataFrame.shape возвращает кортеж, содержащий количество строк в качестве первого элемента и количество столбцов в качестве второго элемента. Индексируя первый элемент, мы можем получить количество строк в DataFrame.
DataFrame.count() со значениями параметров по умолчанию возвращает количество значений по каждому столбцу. Каждый столбец содержит одинаковое количество значений, равное количеству строк. Индексируя первый элемент, мы можем получить количество строк в DataFrame.
Пример 1: подсчет с помощью shape
В этом примере мы будем использовать свойство DataFrame.shape, чтобы получить количество строк.
Пример 2: с помощью count()
В этом примере мы будем использовать метод count() для подсчета количества строк в DataFrame.
В этом руководстве на примерах Python мы узнали, как подсчитать количество строк в заданном DataFrame разными способами с помощью примеров программ.
Фильтрации строк
Чтобы отфильтровать строки в DataFrame, вы можете использовать функцию isin(). Она возвращает логический DataFrame, который при использовании с исходным фильтрует строки, которые подчиняются критериям фильтра.
Вы также можете использовать query() для фильтрации строк, удовлетворяющих заданному логическому выражению.
Пример 1: с помощью isin()
В этом примере мы возьмем DataFrame с двумя столбцами с именами a, b и четырьмя строками. Мы будем фильтровать при условии, что значения столбца a лежат в заданном диапазоне.
Функция isin() возвращает True для строк, значения столбца в которых находятся в диапазоне (3,6). В противном случае функция возвращает false.
df [out] возвращает только те строки, значение которых равно True, что приводит к отфильтрованному выводу.
Пример 2: с помощью query()
В этом примере мы инициализируем DataFrame двумя столбцами a и b, содержащими четыре строки. Мы будем фильтровать те строки, у которых значение столбца b больше 4.
Мы будем использовать query() для фильтрации строк.
В этом руководстве на примерах Python мы узнали, как фильтровать DataFrame на основе условий, применяемых к значениям его столбцов.
Как получить количество строк фрейма данных Pandas?
Я пытаюсь получить количество строк dataframe df с пандами, и вот мой код.
Способ 1:
Способ 2:
оба фрагмента кода дают мне эту ошибку:
TypeError: неподдерживаемый тип(ы) операнда для +: ‘instancemethod’ и ‘int’
что я делаю не так?
По данным ответ дано @ root лучший (the самый быстрый) способ проверить длину df-позвонить:
12 ответов
EDIT: как отметил @Dan Allen в комментариях len(df.index) и df[0].count() не являются взаимозаменяемыми как count исключить NaN s,
предположим df ваш фрейм данных тогда:
из-за одного дополнительного вызова функции он немного медленнее, чем вызов len(df.index) напрямую, но это не должно играть никакой роли в большинстве случаев.
помимо вышеуказанных ответов можно использовать df.axes чтобы получить кортеж с индексами строк и столбцов, а затем использовать len() функция:
для получения строк, используйте
и для столбцов, используйте
вы всегда можете использовать len(anyList) для получения количества списка, следовательно, вы можете использовать len(df.index) для получения количества строк или более короткой попытки len(df) количество строк.
в качестве альтернативы вы можете использовать df.shape[0] and df.shape[1] для получения количества строк и столбцов, соответственно.
Я пришел к панд из R фон, и я вижу, что панды гораздо сложнее, когда дело доходит до выбора строки или столбца. Некоторое время я боролся с этим, потом нашел способ справиться с этим:—4—>
получение количества столбцов:
получение количества строк:
. дом на Ян-Филипп ответа Gehrcke по.
и под капюшоном лен (df)
len(df.index) будет немного быстрее, чем len(df) так это не вызов функции, но это всегда быстрее, чем df.shape[0]
df.shape возвращает форму фрейма данных в виде кортежа (no. из рядов-нет. из седла).
количество строк (используйте любой из):
Если вы хотите получить количество строк в середине цепной операции, вы можете использовать:
Это может быть полезно, если вы не хотите помещать длинный оператор внутри функции len ().
вместо этого вы можете использовать __len__ (), но _ _ len_ _ () выглядит немного странно.
для dataframe df, количество строк в формате печатной запятой, используемое при исследовании данных:
легко одной строкой
даст вам простое количество строк и столбцов
Как я могу получить количество строк в DataFrame панд?
Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код.
Способ 1:
Способ 2:
Оба фрагмента кода дают мне эту ошибку:
Ошибка типа: неподдерживаемые типы операндов для +: ‘instancemethod’ и ‘int’
Что я делаю неправильно?
РЕДАКТИРОВАТЬ: Как @Dan Аллен отметил в комментариях len(df.index) и df[0].count() не являются взаимозаменяемыми, за count исключением NaN s,
Предположим, df что ваш фрейм данных:
Как я могу получить количество строк в DataFrame панд?
Эта таблица суммирует различные ситуации, в которых вы хотите подсчитать что-либо в DataFrame (или Series, для полноты), а также рекомендуемые методы.
Примеры минимального кода
Глупо сравнивать производительность операций с постоянным временем, особенно когда разница находится на уровне «серьезно, не беспокойтесь об этом». Но это похоже на тенденцию с другими ответами, поэтому я делаю то же самое для полноты.
Из 3 описанных выше методов len(df.index) (как уже упоминалось в других ответах) самый быстрый.
Счетчик ненулевых строк: DataFrame.count и Series.count
Методы, описанные здесь, учитывают только ненулевые значения (то есть NaN игнорируются).
Вызов DataFrame.count будет возвращать количество не-NaN для каждого столбца:
Для серии используйте Series.count аналогичный эффект:
Количество строк по группам: GroupBy.size
В обоих случаях Series возвращается. Это также имеет смысл, DataFrames поскольку все группы имеют одинаковое количество строк.
Количество групповых ненулевых строк: GroupBy.count
Следующие методы возвращают одно и то же:
Между тем, у count нас есть
. вызывается для всего объекта GroupBy, v / s,
панды Python как подсчитать количество записей или строк в таблице данных
очевидно, новый для панд. Как я могу просто подсчитать количество записей в фрейме данных.
Я бы подумал, что такая простая вещь, как это, сделает это, и я даже не могу найти ответ в поисках. наверное, потому, что это слишком просто.
приведенный выше код фактически просто печатает весь df
4 ответов
С уважением к вашему вопросу. считая одно поле? Я решил задать вопрос, но надеюсь, это поможет.
скажем, у меня есть следующий DataFrame
вы можете сосчитать один столбец по
оба оценивают до 5.
классная вещь (или одна из многих w.r.т. pandas ) это если у вас есть NA значения, count принимает это во внимание.
так если бы я сделал
результат будет будь
получить количество строк в таблице данных:
(и df.shape[1] получить количество столбцов).
в качестве альтернативы вы можете использовать
(и len(df.columns) для столбцов)
избежать: count() потому что он возвращает количество наблюдений не-NA / null над запрошенной осью
len(df.index) быстрее
df.__len__ это просто вызов len(df.index)
почему вы не должны использовать count()
просто row_num = df.shape[0] # дает количество строк, вот пример:
пример Nan выше пропускает одну часть, что делает его менее общим. Для этого более «обобщенно» используйте df[‘column_name’].value_counts() Это даст вам количество каждого значения в этом столбце.
Как получить количество строк в pandas DataFrame?
Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код.
Способ 1:
Способ 2:
Оба фрагмента кода дают мне эту ошибку:
Ошибка типа: неподдерживаемые типы операндов для +: ‘instancemethod’ и ‘int’
Что я делаю неправильно?
Правка: Как @Dan Аллен отметил в комментариях len(df.index) и df[0].count() не являются взаимозаменяемыми, так как count исключает NaN s,
Как получить количество строк в pandas DataFrame?
Эта таблица суммирует различные ситуации, в которых вы хотите подсчитать что-либо в DataFrame (или Series, для полноты), а также рекомендуемые методы.
Примеры минимального кода
Глупо сравнивать производительность операций с постоянным временем, особенно когда разница находится на уровне «серьезно, не беспокойтесь об этом». Но это похоже на тенденцию с другими ответами, поэтому я делаю то же самое для полноты.
Из 3 методов, описанных выше, len(df.index) (как упоминалось в других ответах) является самым быстрым.
Число ненулевых строк: DataFrame.count и Series.count
Методы, описанные здесь, учитывают только ненулевые значения (то есть NaN игнорируются).
Вызов DataFrame.count вернет число не-NaN для каждого столбца:
Для серии используйте Series.count для получения аналогичного эффекта:
Количество строк по группам: GroupBy.size
В обоих случаях возвращается Series name__. Это имеет смысл и для DataFrames name__, поскольку все группы имеют одинаковое количество строк.
Количество ненулевых строк в группе: GroupBy.count
Следующие методы возвращают одно и то же:
Между тем, для count мы имеем
. вызывается для всего объекта GroupBy, v/s,