Такой вот простой вопрос, для знатоков покажется дурацким... извините, только учусь В С встречается такое выражение... #define aaaa L"Строкакакаято" Так вот... Я так понимаю что L здесь указывает на тип строки? Типа там Ansi, Unicode, WideString ... ? Если да то перечислите плиз какие ещё есть.
Код (Text): const char *str1 = "abcd"; //ANSI string (8 bits per char) const wchar_t *str2 = L"abcd"; // UNICODE string (16 bits per char)
Это считаю большим минусов в C. Приходится делать так: Код (Text): #ifdef UNICODE const char *str1 = "abcd"; #else const wchar_t *str1 = L"abcd"; #endif
KeSqueer Ну, учитывая что мир не стоит на месте и уникоде - не окончательное достижение в записи строк, С-шная гибкость дающая возможность достаточно просто учитывать различные колебания моды на стандарты это не просто не минус, а большой плюс. Ваша прога сможет пережить уникоде, отделавшись только несколькими новыми #ifdef
z_x_spectrum Было время когда и восьмибитная кодировка была экзотикой. И когда ASCII еще стандартом не был. Кроме того, разве уникоде на 100% перекрывает китайские и японские иероглифы? А разве все возможные значки и не сильно распространенные символы с черточками перекрываются? Сначала в уникоде было 2 байта, потом 4, теперь о 8и говорят.. utf8 для упрощения создали. Машины стают очень мощными и наверно в строках будут отражать и особенности рукописного ввода или векторные картинки или форматирование. Вобщем фантазии нет предела. Зачем это надо. После введения и старательного рекламирования нового формата ('технологии') клиенты начнут настоятельно требовать ее наличия в продукте не взирая на ее нужность продукту, разрабы будут вынуждены обновлять инструменты и покупать, и лицензировать, и.. одним словом башлять бабки. Таким образом, не надейтесь, что уникоде - последний вывих прогресса.
Нет ни японских, ни южнокорейских иероглифов. Иероглифы имеют китайское происхождение и в Сингапуре, и в Японии, и в КНР иероглиф передает одно и то же значение (как у европейцев цифры), но вот читаться один и тот же иероглиф даже в Китае (в зависимости от диалекта) будет по-разному. Среднестатистический образованный китаец использует 10-15 тысяч иероглифов, так что unicode возможность кодировать иероглифы перекрывает с лихвой
KeSqueer, делать надо так: Код (Text): _TCHAR *str = _T("Astring"); а все #defines уже есть в MS заголовках.
Э-э... а кто такая "фундаментальная кодировка UNICODE". Выберите из списка: UTF7, UTF8, UTF16, UTF32 ?
Достаточно первых страничек учебников китайского, корейского, японского языка, там где речь идет о письменной системе, но если Вики подойдет, тогда: >Нет ни японских, ни южнокорейских иероглифов. Иероглифы имеют китайское происхождение и в Сингапуре, и в Японии, и в КНР иероглиф передает одно и то же значение (как у европейцев цифры),Используется фонетическое письмо хангыль, специально разработанное для корейского языка в XV веке. Дополнением к хангылю служат ханчча — китайские иероглифы. В Северной Корее используется только хангыль, в Южной Корее — и хангыль, и ханчча. Японская письменность обслуживается ка́ндзи (иероглифами заимствованными из Китая), двумя азбуками, созданными в Японии - катакана и хирагана (вместе называемые просто кана́), а также присоединившимися к ним в более позднее время латинскими буквами и арабскими цифрами. >но вот читаться один и тот же иероглиф даже в Китае (в зависимости от диалекта) будет по-разному. Частый в лингвистике вопрос «язык или диалект?» особенно интересен в ситуации с китайским. С одной стороны, в этом вопросе политический аспект не менее важен, чем лингвистический. С чисто лингвистической точки зрения многие из этих идиомов вполне соответствуют критериям языка. С другой стороны, у всех этих идиомов общий письменный язык и литература, что склоняет чашу весов к их определению как диалектов. Поскольку письменный язык по грамматике наиболее близок к путунхуа (официальный вариант китайского языка, основан на пекинской норме произношения), то многие китайцы воспринимают его как «настоящий» китайский язык, а всё остальное — как диалекты >Среднестатистический образованный китаец использует 10-15 тысяч иероглифов Из-за непрерывного и постепенного изменения иероглифов невозможно определить их точное количество. Повседневно используемых иероглифов несколько тысяч. Согласно статистике, 1000 обиходных иероглифов покрывают 92 % печатных материалов, 2000 могут покрыть более 98 %, а 3000 иероглифов уже покрывают 99 %. Статистические результаты по упрощенным и традиционным иероглифам различаются незначительно.
Mikl___ Как бы то ни было, начертания у них слегка отличаются (а где и не слегка) и сложно верить, что такие исторически недолюбливающие друг друга народы договорятся. Как пример, они относятся к разным кодировкам (gb, big5, katakana, hiragana). Опять же, на китае-японских иероглифах свет клином не сошелся. Есть или были и другие расточительные формы письма и все они имеют место в уникоде. А будут еще.. Например, неплоха была бы возможность включать в стандартную строку свои глифы, например в векторной форме. Согласен, структура кодировки будет сложной, но ту-же современную utf8 назвать простой как ASCII трудно. В общем, мысль свою я выразил где-то выше, а все эти иероглифы - пример только.
_basmp_ [offtop]Не хочу обидеть, но вопросу по кодировке иероглифов место в хипе или в личной переписке, чему я был бы очень рад просто мы начали забивать офтопом WASM.LANG.C [/offtop]