как узнать латинская или русская буква
Поиск символов латиницы в русском тексте
Использование символов латиницы в русском тексте порождает огромное количество проблем. От путаницы при банальной сортировке по алфавиту до некорректной консолидации данных при автоматическом объединении нескольких таблиц в одну.
Выискивать похожие по виду символы и проверять не являются ли они символами английской раскладки крайне муторно. Поэтому поищем более изящные варианты.
Способ 1. Шрифт без кириллицы
Выделите диапазон ячеек с проверяемым текстом и временно установите для него любой шрифт не содержащий кириллицу, например Albertus или любой аналогичный (находится методом тыка). Внешний вид символов кириллицы и латиницы станет отличаться и можно будет легко визуально локализовать некорректные символы:
Способ 2. Функция IsLatin на VBA
Закройте редактор Visual Basic и вернитесь в Excel.
Теперь в Мастере функций в категории Определенные пользователем (User Defined) можно найти нашу функцию IsLatin и воспользоваться ей. Синтаксис функции следующий:
Функция выдаст значение ИСТИНА (TRUE), если найдет в тексте А2 хотя бы один символ латиницы. В противном случае функция вернет значение ЛОЖЬ (FALSE):
Способ 3. Подсветка символов латиницы красным цветом шрифта
Найти латиницу или кириллицу в тексте
Важно: поскольку термин «найти» часто в сознании людей предполагает «найти и извлечь», сразу оговоримся, что ниже именно булевая интерпретация поиска, иначе говоря, результата два — нашел или не нашел. Похожая, но все же другая задача — извлечь символы латиницы.
Текст, содержащий латиницу помимо кириллицы — довольно частое явление, и выявить, в какой раскладке текст, не всегда возможно визуально. Начертание многих символов в обеих раскладках идентично.
Когда нужно просто глазами обнаружить латиницу среди кириллических символов или наоборот, кириллицу в английском тексте, есть очень простое решение — использование неклассических шрифтов в Excel.
Например, Dubai Light сделает латиницу тоньше, Dubai Medium — жирнее кириллицы, Microsoft Himalaya — ниже, а Ink Free — выделит ее курсивом.
Но когда исходных данных много, важно не просто видеть, но и иметь возможность отфильтровать или отсортировать такие ячейки. Вариантов упростить и ускорить решение задачи несколько.
Найти латиницу в Excel — функция
Задача поиска букв латинского алфавита в тексте — одна из нетривиальных в Excel, как и поиска любой длинной последовательности единичных символов. Как и в случае с поиском цифр, при обычном поиске придется перебирать все латинские буквы — а их 26, что еще больше, чем цифр.
Составная формула массива пригодится в случаях, когда не хочется или нет возможности пользоваться макросами или пользовательскими функциями (UDF):
Здесь A1 — ячейка, которую мы хотим «проверить» на наличие в ней латиницы. Функция возвращает «ИСТИНА» или «ЛОЖЬ».
Важно отметить, что функция «ПОИСК» не является регистрозависимой, поэтому позволяет найти буквы в любом регистре.
Можно ли диапазон букв выразить иным способом? Да, формулой массива, а помогут в этом функция СИМВОЛ и функция СТРОКА:
Отличие этой формулы массива от предыдущей — ее нужно вводить без фигурных скобок, они появятся при вводе формулы сочетанием Ctrl + Shift + Enter (вместо обычного Enter ). В формуле выше, где явно прописаны все буквы, фигурные скобки вводятся вручную — это явное указание строкового массива.
Найти кириллицу в Excel — функция
Как вы, наверное, догадались, найти кириллицу в тексте можно аналогичным путем:
Или формулой массива с функцией СИМВОЛ:
Формула массива будет работать корректно, если языком системы для non-Unicode программ выбран русский.
Есть небольшая разница в двух этих формулах — вторая в отличие от первой использует 32 буквы, т.к. буква Ё не входит в диапазон символов.
Как найти прописные буквы
В отличие от «ПОИСК», «НАЙТИ» — функция регистрозависимая, что позволяет найти буквы в том регистре, в котором они перечислены.
Функция поиска прописных символов латиницы
Функция поиска прописных кириллических символов
Функция поиска любых прописных символов
Поможет вам найти в ячейке символы и кириллицы, и латиницы, если они написаны заглавными буквами.
Для поиска цифр в ячейке можно использовать такой же синтаксис.
Функции «Найти латиницу» и «Найти кириллицу» с помощью UDF
UDF (User-defined function, пользовательская функция) — тем, кто часто использует функции такого плана, помогут упростить синтаксис на листе, т.к. содержат калькуляции в коде.
Найти латинские буквы в 2 клика
Найти слова, содержащие и кириллицу, и латиницу
Иногда простой поиск в ячейке латиницы и кириллицы не решает проблему, т.к. в ячейке изначально подразумевается наличие обоих видов символов. Например, «автомобиль Tоyоta», «холодильник Siеmеns». В двух этих примерах специально вставлены буквы из другого алфавита: Tоyоta содержит кириллическую «о», а Siеmеns — кириллическую «e». Начертание этих символов идентичное, но вот для роботов это совершенно разные символы.
Как с помощью Excel проверить отличие в написании букв на латинице или кириллице в отдельных словах? Формулы выше не отличат фразы, написанные корректно, от фраз, написанных некорректно, так как отдадут «ИСТИНА» всем фразам при проверке на кириллицу и латиницу.
С помощью регулярных выражений
Процедура находится в меню «ОБНАРУЖИТЬ» — «Слова» — «По паттерну». Паттерн REGEX позволяет решить задачу в один заход, т.к. в нем есть оператор «ИЛИ».
Данное выражение означает, что нужно найти слова, в которых или после кириллического символа идет символ латиницы, или наоборот. При этом между символами могут быть внутри слова любые другие символы (цифры, дефисы и любые другие, кроме пробела).
Применяем регулярное выражение из этой статьи для поиска слов, содержащих кириллицу и латиницу
В две итерации
Данный метод совершенно логичен, но требует чуть больше времени. Нужно просто сначала извлечь слова, содержащие латиницу, а потом, уже среди извлеченных этим способом, искать слова, содержащие кириллицу.
Кейсы дальнейшего взаимодействия с данными
Найти слова, содержащие кириллицу, латиницу или оба вида символов одновременно, — только полдела. За этапом их обнаружения зачастую следуют дальнейшие действия.
Удалить
Иногда нужно удалить слова, содержащие латиницу.
Извлечь
Изменить регистр
Бывают ситуации, когда слова, содержащие латиницу, имеет смысл сделать с заглавной буквы — это касается все тех же иностранных брендов.
Заменить символы
И, наконец, бывают ситуации, когда нужно заменить кириллицу на латиницу — но и здесь возможны вариации: можно транслитерировать, сменить раскладку или заменить символы на похожие с ними на другом языке. Подробнее про последний кейс: заменить русские буквы на английские и наоборот.
Про каждый из этих кейсов можно почитать с соответствующем разделе сайта, в надстройке присутствуют макросы для быстрой обработки подобных ситуаций.
Как найти подмену символов латиницы на кириллицу и наоборот в тексте или программе
Поиск онлайн
Подсветка в тексте символов букв русской или английской раскладки
(выделение цветом латиницы или кириллицы) в онлайн режиме или
оффлайн окне браузера (JavaScript)
Решил, потрачу часик и сделаю программку подсветки символов, чтобы подобная напасть больше не повторялась. Часик вылился в вечерок, до поздней ночи, но своего я добился, теперь программа подсветки кириллических или латинских символов прямо в браузере, онлайн, у меня под рукой.
Поместил ее в копилке блога, может кому-то еще пригодится:
Подсветка в тексте символов букв русской или английской раскладки
Нужно выделить: Латиницу Кириллицу
ВНИМАНИЕ! При перезагрузке страницы введенная информация не сохраняется!
Полагаю, что поиск опечаток из-за ошибок переключения раскладки в обычном тексте, тоже может улучшить его качество, хотя здесь чаще всего помогает проверка правописания. А в Word есть еще некий экзотический шрифт, в котором латинские и кириллические символы разительно отличаются друг от друга (названия не помню, но когда-то пользовался. )
Если в тексте много специальных терминов, думаю, что лучше всего провериться здесь.
В заключение хочется отметить: Важным премуществом предложенной здесь программы является тот факт, что обработка всех данных происходит исключительно на Вашем устройстве с помощью загруженного вместе со страницей безопасного Java Script кода, и вводимая в текст-бокс информация ни на какие сторонние серверы не отправляется, более того, при перезагрузке страницы она полностью стирается. Еще мне понравилась идея визуализации текстовых символов различного назначения и проведения на одной странице различных видов статистической обработки текста. Правда, пока она реализована как дополнение программы подсветки символов простейшим счетчиком знаков в том числе и неотображаемых табуляционных. В случае, если вам необходимая еще какая-то статистическая информация о символах в тексте, например, количество или частота букв «а» или «о», пишите.
Транслитерация имени и фамилии для авиабилета в 2018г.
Онлайн сервис транслитерации имени и фамилии для загранпаспорта заменяет буквы русского алфавита латинскими буквами по правилам, установленным Федеральной миграционной службой России.
Таблица транслитерации имени и фамилии для загранпаспорта:
Транслитерация для загранпаспорта и для покупки авиабилетов в 2016 г.
С 2014 г. действуют новые правила записи славянских имён в заграничных паспортах. Правила регулируются двумя федеральными документами:
— ГОСТом Р 52535.1-2006, где прописаны требования к оформлению машиносчитываемой дорожной документации (паспортов);
— приказом российской федеральной службы миграции (№211 от 26/03/2014) о новом регламенте услуги по подготовке/выдаче паспортов, подтверждающих гражданство РФ за пределами страны.
Для чего разработаны новые правила
Цель изменений – соответствие русских записей латинскими буквами международному стандарту. Причина – переход России к международным стандартам написания имён собственных в паспортах для поездки за границу.
Буквы русской азбуки заменяются латинским алфавитом на основе рекомендованного организацией ИКАО (межгосударственные пассажирские авиаперевозки) стандартом. В регламентах ICAO (doc.9303/1/IV) представлена таблица соответствия кириллических и латинских знаков, с которой полностью соотносится таблица ГОСТа-2006.
Транслитерация для заграничных паспортов
(ГОСТ Р 52535.1-2006, ИКАО, изменения-2014)
Русский алфавит
Латинский алфавит
Русский алфавит
Латинский алфавит
Русский алфавит
Латинский алфавит
Русский алфавит
Латинский алфавит
Русский алфавит
Латинский алфавит
Какие изменения внесены
Изменения распространяются не на всю азбуку. Они коснулись конвертирования букв Ё, Е, Й, Ц, Щ, Ъ, Ю, Ь, Я.
Примеры замены русских букв латинскими в разных позициях на основе сопоставления ГОСТа-2000 и правил-2014 приведены в таблице 2.
Различия в правилах транслитерации некоторых русских букв
Кириллица
Латиница
ГОСТ-7.79-2000 (Б)
ИСО-9
LC ИКАО док 9303
(правила для оформления загранпаспортов с 2014 г.)
Транслитерация при бронировании и покупке авиабилетов за границу
Запись имени/фамилии в авиабилете на международнй рейс должна польностью соответствовать транслитерации в паспорте. На сайтах авиакомпаний выложены прямая ссылка на приказ ФМС и таблицы транслитерации, по которым можно сверить правильность записи.
Приобретение авиабилетов через интернет
Бронируя билеты через интернет, необходимо внимательно переносить знаки из заграничного паспорта в бланк квитанции.
Автоматическими сервисами перевода записи фамилий из латиницы в кириллицу следует пользоваться с осторожностью и с дополнительными проверками: многочисленные онлайн-сервисы с такой услугой выполняют конверсию на основе разных систем.
Правила многих авиакомпаний не запрещают пассажирам, которые имеют заграничные паспорта нового образца, лететь по билету, оформленному и выкупленному по предыдущему паспорту. Это условие выполняется и при наличии незначителных несовпадений в транслитерации фамилии/имени. Паспорта действительны для пересечения государственной границы на предусмотренный срок.
Если в авиабилете обнаружены расхождения с паспортом
По общему неофициальному правилу допускается до 3-х неточностей/разночтений в написании имени и фамилии (не путать с ошибками). Такие расхождения обычно вызваны вариантами ГОСТов (Шарий → Sharij/Sharii). Негласного правила придерживаются многие авиакомпании. Но в некоторых странах и авиакомпаниях расхождения в паспорте и авиабилете из-за разных ГОСТов признаются ошибками, и с пассажиров визмается штраф (авиакомпания Finnair, например).
Информация, которая может быть полезной при оформлении авиабилета за границу
Что не является ошибкой и не вызовет проблем при пересечении границы:
— варианты форм обращения MR, MRS, MISS, DR, SIR – это не собственные имена;
— несоответствие дат срока действия купона на рейс и загранпаспорта;
— переставленные местами в документе имя/фамилия. У стойки регистрации нужно предупредить об этом сотрудницу аэропорта, чтобы не увеличивать время на поиск пассажира в базе авиакомпании;
— отсутствие в электронном авиабилете подстрочного перевода для налоговых служб. Проездные расходы легко проверяются другими методами.
Если расхождения обнаружены раньше рейса, стоит уведомить компанию. В бланк бронирования будет внесена соответствующая информация.
Что считается ошибкой:
— несовпадение цифр серии и номера в паспорте и авиабилете;
— варианты написаний, которые нельзя объяснить правилами разных стандартов.
Чтобы авиаперелёт не омрачился проблемами, нужно помнить рекомендации авиакомпаний:
Латинские буквы (алфавит): происхождение, состав латиницы и языки использования
Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Абсолютное большинство письменных языков, распространенных на территории современных Европы, Северной и Южной Америк, Австралии, отчасти Африки, постсоветских территорий Азии используют буквенную письменность, восходящую к двум основным алфавитам.
Это латиница и кириллица.
Латиница — это.
Кириллическими графемами пользуются носители восточно- и южнославянских языков, а также младописьменные народы. Весь остальной мир в ходе исторических событий перешел на латинские буквы, даже если изначально имел свои.
Такие переходы актуальны даже сейчас. К примеру, в Казахстане в 2017 году начали применять латинскую графику в качестве основной.
Итак, латинские буквы – это какие? Ответить на этот вопрос может любой, кто хоть раз сталкивался с английским, немецким, французским, испанским… Алфавиты этих и многих других языков классически построены на графемах латыни.
Латинские буквы
Современная латиница состоит из 26 графем. В некоторых европейских языках дополняется особыми знаками.
Например, умлауты в немецком всегда представлены после 26-ой графемы, но в основной алфавит при этом не входят. В латышский же диакритические знаки включены сразу.
Латинские буквы – это основа письменности большинства германских, романских, балтийских, отчасти славянских и других языков.
Актуальный состав латиницы представлен в таблице:
История латинского алфавита
Латиница была создана в середине первого тысячелетия до нашей эры, ориентировочно в 7 веке до н.э. Изначально это был алфавит древних римлян.
Он разрабатывался на основе этрусского, который, в свою очередь, восходит к одному из наиболее совершенных для Античной Европы набору графем – греческому. Позднее стал использоваться в Римской республике, а потом и Империи.
Благодаря успеху государства на мировой арене распространился на огромной территории.
Изначально в алфавите была только 21 графема. В I веке до н.э. добавили буквы G, Y, вернули временно исключенную Z. Буквы J, U, W появились значительно позже – уже в новое время.
Уже после развала Римской империи именно латинская письменность легла в основу так называемых народных языков. Они возникли во вновь образованных национальных государствах Европы. Уже как часть этих языков письмо древних римлян эмигрировало в страны Нового света.
Таким образом, со своей географической родины – Италии – латиница территориально была «расселена» практически по большей части суши.
Речь, конечно, идет только о графемах: их звуковое отражение в языках может заметно отличаться.
Распространение латиницы в наше время
Сегодня латиница – это самый распространенный алфавит в мире.
Она лежит в основе всех языков таких групп (в скобках указаны самые популярные лингвосистемы):
Также латиница используется как алфавит некоторых языков в южнославянской, финно-угорской, тюркской группах. Данные графемы применяются в отдельной выделенных албанском и вьетнамском языках.
География распространения представлена на карте:
Такое территориальное превалирование – несомненно, результат успешности Римского государства, а позднее – стран Европы, которые колонизировали обе Америки, Австралию, частично Океанию и Африку.
«Русская латиница»
В разное время отечественной истории латинский алфавит пробовали использовать и для передачи на письме русской речи.
Первые попытки соотносятся с XVI—XVIII веками, предприняты они были представителями Великого княжества Литовского, Речи Посполитой, которые владели территориями современной Украины. Соответственно, излагали на письме западнорусский вариант языка.
*при клике по картинке она откроется в полный размер в новом окне
Также русские слова латиницей записывали путешественники – носители французского, английского языков. Обычный для них рад графем дополнялся кириллическими буквами, которые нечем было заменить.
Отдельные проекты по серьезному введению латинского алфавита как основы русского правописания предлагались как в Российской империи, так и в Советском Союзе, но до практической реализации не дошло.
Новейшее аналогичное предложение поступило в 2017 году от депутата Владимира Петрова, который предложил сотрудникам РАН создать параллельную русскую азбуку, основанную на латинской графике. Ученые инициативу политика не поддержали.
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
Эта статья относится к рубрикам:
Комментарии и отзывы (4)
Кириллическими графемами пользуются носители восточно- и южнославянских языков, а также младописьменные народы. Весь остальной мир в ходе исторических событий перешел на латинские буквы.
ребята, весь мир — это и арабские страны со своей графикой. И Израиль, и Греция, и Эфиопия, и Таиланд с Индией. Я уж не говорю про иероглифические системы письменности. Не упрощайте
неточности. Вы подаете, как пример, именно российскую кириллицу а не просто кириллицу. Потому что буквы там явно не все, какие в кириллице бывают.
«владели территориями современной Украины. Соответственно, излагали на письме западнорусский вариант языка»
то Украина, то западнорусский вариант языка (что это за язык такой? и куда подевался украинский, раз это происходило на землях с укр.населением). А на иллюстрации по-моему белорусский.
Что-то тут напутано слегка. Эти языки к тому времени уже были самостоятельными и имели свои особенности, не стоит их мешать в одну кучу.
Соглашусь с drevlianin, латиница используется только в тех странах, которые остаются колонией Запада.
Бесспорно, самый лучший алфавит! Простой, универсальный, удобоваримое произношение слов в большинстве языков.