xref: /titanic_53/usr/src/lib/iconv_modules/vi/common/tcvn%viscii.c (revision 91e1e26ac6a73ce959289cf7d3d96c4baedbe0b8)
1*91e1e26aSAlexander Pyhalov /*
2*91e1e26aSAlexander Pyhalov  * CDDL HEADER START
3*91e1e26aSAlexander Pyhalov  *
4*91e1e26aSAlexander Pyhalov  * The contents of this file are subject to the terms of the
5*91e1e26aSAlexander Pyhalov  * Common Development and Distribution License (the "License").
6*91e1e26aSAlexander Pyhalov  * You may not use this file except in compliance with the License.
7*91e1e26aSAlexander Pyhalov  *
8*91e1e26aSAlexander Pyhalov  * You can obtain a copy of the license at src/OPENSOLARIS.LICENSE
9*91e1e26aSAlexander Pyhalov  * or http://www.opensolaris.org/os/licensing.
10*91e1e26aSAlexander Pyhalov  * See the License for the specific language governing permissions
11*91e1e26aSAlexander Pyhalov  * and limitations under the License.
12*91e1e26aSAlexander Pyhalov  *
13*91e1e26aSAlexander Pyhalov  * When distributing Covered Code, include this CDDL HEADER in each
14*91e1e26aSAlexander Pyhalov  * file and include the License file at src/OPENSOLARIS.LICENSE.
15*91e1e26aSAlexander Pyhalov  * If applicable, add the following below this CDDL HEADER, with the
16*91e1e26aSAlexander Pyhalov  * fields enclosed by brackets "[]" replaced with your own identifying
17*91e1e26aSAlexander Pyhalov  * information: Portions Copyright [yyyy] [name of copyright owner]
18*91e1e26aSAlexander Pyhalov  *
19*91e1e26aSAlexander Pyhalov  * CDDL HEADER END
20*91e1e26aSAlexander Pyhalov  */
21*91e1e26aSAlexander Pyhalov /*
22*91e1e26aSAlexander Pyhalov  * Copyright (c) 2008, by Sun Microsystems, Inc.
23*91e1e26aSAlexander Pyhalov  * All rights reserved.
24*91e1e26aSAlexander Pyhalov  */
25*91e1e26aSAlexander Pyhalov 
26*91e1e26aSAlexander Pyhalov #include <stdio.h>
27*91e1e26aSAlexander Pyhalov #include <errno.h>
28*91e1e26aSAlexander Pyhalov #include <stdlib.h>
29*91e1e26aSAlexander Pyhalov #include <sys/types.h>
30*91e1e26aSAlexander Pyhalov #define __NEED_TCVN_2_VISCII__
31*91e1e26aSAlexander Pyhalov #include <viscii_tcvn.h>    /* VISCII <-> TCVN mapping table */
32*91e1e26aSAlexander Pyhalov #include <vi_combine.h>
33*91e1e26aSAlexander Pyhalov #include "common_defs.h"
34*91e1e26aSAlexander Pyhalov 
35*91e1e26aSAlexander Pyhalov 
36*91e1e26aSAlexander Pyhalov #define NON_ID_CHAR '?'     /* non-identified character */
37*91e1e26aSAlexander Pyhalov 
38*91e1e26aSAlexander Pyhalov typedef struct _icv_state {
39*91e1e26aSAlexander Pyhalov     int	_errno;		/* internal errno */
40*91e1e26aSAlexander Pyhalov     unsigned short last;
41*91e1e26aSAlexander Pyhalov } _iconv_st;
42*91e1e26aSAlexander Pyhalov 
43*91e1e26aSAlexander Pyhalov 
44*91e1e26aSAlexander Pyhalov static int binsearch(unsigned short x, Combine_map_tcvn v[], int n);
45*91e1e26aSAlexander Pyhalov 
46*91e1e26aSAlexander Pyhalov /*
47*91e1e26aSAlexander Pyhalov  * Open; called from iconv_open()
48*91e1e26aSAlexander Pyhalov  */
49*91e1e26aSAlexander Pyhalov void *
_icv_open()50*91e1e26aSAlexander Pyhalov _icv_open()
51*91e1e26aSAlexander Pyhalov {
52*91e1e26aSAlexander Pyhalov     _iconv_st *st;
53*91e1e26aSAlexander Pyhalov 
54*91e1e26aSAlexander Pyhalov     if ((st = (_iconv_st *)malloc(sizeof(_iconv_st))) == NULL) {
55*91e1e26aSAlexander Pyhalov         errno = ENOMEM;
56*91e1e26aSAlexander Pyhalov 	return ((void *) -1);
57*91e1e26aSAlexander Pyhalov     }
58*91e1e26aSAlexander Pyhalov 
59*91e1e26aSAlexander Pyhalov     st->_errno = 0;
60*91e1e26aSAlexander Pyhalov     st->last = 0;
61*91e1e26aSAlexander Pyhalov     return ((void *) st);
62*91e1e26aSAlexander Pyhalov }
63*91e1e26aSAlexander Pyhalov 
64*91e1e26aSAlexander Pyhalov 
65*91e1e26aSAlexander Pyhalov /*
66*91e1e26aSAlexander Pyhalov  * Close; called from iconv_close()
67*91e1e26aSAlexander Pyhalov  */
68*91e1e26aSAlexander Pyhalov void
_icv_close(_iconv_st * st)69*91e1e26aSAlexander Pyhalov _icv_close(_iconv_st *st)
70*91e1e26aSAlexander Pyhalov {
71*91e1e26aSAlexander Pyhalov     if (!st)
72*91e1e26aSAlexander Pyhalov         errno = EBADF;
73*91e1e26aSAlexander Pyhalov     else
74*91e1e26aSAlexander Pyhalov         free(st);
75*91e1e26aSAlexander Pyhalov }
76*91e1e26aSAlexander Pyhalov 
77*91e1e26aSAlexander Pyhalov 
78*91e1e26aSAlexander Pyhalov /*
79*91e1e26aSAlexander Pyhalov  * Actual conversion; called from iconv()
80*91e1e26aSAlexander Pyhalov  */
81*91e1e26aSAlexander Pyhalov size_t
_icv_iconv(_iconv_st * st,char ** inbuf,size_t * inbytesleft,char ** outbuf,size_t * outbytesleft)82*91e1e26aSAlexander Pyhalov _icv_iconv(_iconv_st *st, char **inbuf, size_t *inbytesleft,
83*91e1e26aSAlexander Pyhalov 				char **outbuf, size_t *outbytesleft)
84*91e1e26aSAlexander Pyhalov {
85*91e1e26aSAlexander Pyhalov     int     unconv = 0;
86*91e1e26aSAlexander Pyhalov     int             idx = -1;
87*91e1e26aSAlexander Pyhalov     unsigned char   chout = 0;
88*91e1e26aSAlexander Pyhalov #ifdef DEBUG
89*91e1e26aSAlexander Pyhalov     fprintf(stderr, "==========     iconv(): TCVN5712 -->UCS-2   ==========\n");
90*91e1e26aSAlexander Pyhalov #endif
91*91e1e26aSAlexander Pyhalov     if (st == NULL) {
92*91e1e26aSAlexander Pyhalov         errno = EBADF;
93*91e1e26aSAlexander Pyhalov         return ((size_t) -1);
94*91e1e26aSAlexander Pyhalov     }
95*91e1e26aSAlexander Pyhalov 
96*91e1e26aSAlexander Pyhalov     if (inbuf == NULL || *inbuf == NULL) { /* Reset request. */
97*91e1e26aSAlexander Pyhalov         st->_errno = 0;
98*91e1e26aSAlexander Pyhalov         return ((size_t) 0);
99*91e1e26aSAlexander Pyhalov     }
100*91e1e26aSAlexander Pyhalov 
101*91e1e26aSAlexander Pyhalov     st->_errno = 0;     /* Reset internal errno */
102*91e1e26aSAlexander Pyhalov     errno = 0;          /* Reset external errno */
103*91e1e26aSAlexander Pyhalov 
104*91e1e26aSAlexander Pyhalov     /* Convert tcvn encoding to UCS-2 */
105*91e1e26aSAlexander Pyhalov     while (*inbytesleft > 0 && *outbytesleft > 0) {
106*91e1e26aSAlexander Pyhalov         unsigned char ch = 0;
107*91e1e26aSAlexander Pyhalov 
108*91e1e26aSAlexander Pyhalov         if (st->last != 0) {
109*91e1e26aSAlexander Pyhalov             if (ISCOMB_TCVN((unsigned char)**inbuf)) {
110*91e1e26aSAlexander Pyhalov                 /*
111*91e1e26aSAlexander Pyhalov                  * Composed characters with combine character
112*91e1e26aSAlexander Pyhalov                  */
113*91e1e26aSAlexander Pyhalov                 idx =  binsearch(st->last, tcvn_comb_data, VOWEL_NUM);
114*91e1e26aSAlexander Pyhalov                 if (idx >= 0) {
115*91e1e26aSAlexander Pyhalov                     ch = tcvn_comb_data[idx].composed[(unsigned char)**inbuf - 0xb0];
116*91e1e26aSAlexander Pyhalov                 } else {
117*91e1e26aSAlexander Pyhalov                     errno = EBADF;
118*91e1e26aSAlexander Pyhalov                     return ((size_t)-1);
119*91e1e26aSAlexander Pyhalov                 }
120*91e1e26aSAlexander Pyhalov                 st->last = 0;
121*91e1e26aSAlexander Pyhalov             } else {
122*91e1e26aSAlexander Pyhalov                 tcvn_2_viscii(st->last, &chout);
123*91e1e26aSAlexander Pyhalov                 if (st->last != 0x0 && chout == 0x0) {
124*91e1e26aSAlexander Pyhalov                     unconv++;
125*91e1e26aSAlexander Pyhalov                     chout = NON_ID_CHAR;
126*91e1e26aSAlexander Pyhalov                 }
127*91e1e26aSAlexander Pyhalov 
128*91e1e26aSAlexander Pyhalov                 *(*outbuf)++ = chout;
129*91e1e26aSAlexander Pyhalov                 (*outbytesleft) -= 1;
130*91e1e26aSAlexander Pyhalov                 ch = (unsigned char)**inbuf;
131*91e1e26aSAlexander Pyhalov             }
132*91e1e26aSAlexander Pyhalov             st->last = 0;
133*91e1e26aSAlexander Pyhalov         } else {
134*91e1e26aSAlexander Pyhalov             ch = (unsigned char)**inbuf;
135*91e1e26aSAlexander Pyhalov             if (ch >= 0x41 && ch <= 0xad
136*91e1e26aSAlexander Pyhalov                 && ((tcvn_comp_bases_mask0[(ch-0x40) >> 5] >> (ch & 0x1f)) & 1)) {
137*91e1e26aSAlexander Pyhalov                 /*
138*91e1e26aSAlexander Pyhalov                  * uni is vowel, it's a possible match with combine character.
139*91e1e26aSAlexander Pyhalov                  * Buffer it.
140*91e1e26aSAlexander Pyhalov                  * */
141*91e1e26aSAlexander Pyhalov                 st->last = ch;
142*91e1e26aSAlexander Pyhalov                 (*inbuf)++;
143*91e1e26aSAlexander Pyhalov                 (*inbytesleft)--;
144*91e1e26aSAlexander Pyhalov                 continue;
145*91e1e26aSAlexander Pyhalov             }
146*91e1e26aSAlexander Pyhalov         }
147*91e1e26aSAlexander Pyhalov 
148*91e1e26aSAlexander Pyhalov 
149*91e1e26aSAlexander Pyhalov         tcvn_2_viscii(ch, &chout);
150*91e1e26aSAlexander Pyhalov         if (ch != 0x0 && chout == 0x0) {
151*91e1e26aSAlexander Pyhalov             unconv++;
152*91e1e26aSAlexander Pyhalov             chout = NON_ID_CHAR;
153*91e1e26aSAlexander Pyhalov         }
154*91e1e26aSAlexander Pyhalov 
155*91e1e26aSAlexander Pyhalov         *(*outbuf)++ = chout;
156*91e1e26aSAlexander Pyhalov         (*outbytesleft) -= 1;
157*91e1e26aSAlexander Pyhalov 	(*inbuf)++;
158*91e1e26aSAlexander Pyhalov         (*inbytesleft)--;
159*91e1e26aSAlexander Pyhalov 
160*91e1e26aSAlexander Pyhalov     }
161*91e1e26aSAlexander Pyhalov 
162*91e1e26aSAlexander Pyhalov     if ( *inbytesleft > 0 && *outbytesleft <= 0 ) {
163*91e1e26aSAlexander Pyhalov         errno = E2BIG;
164*91e1e26aSAlexander Pyhalov         st->last = 0;
165*91e1e26aSAlexander Pyhalov         return ((size_t)-1);
166*91e1e26aSAlexander Pyhalov     }
167*91e1e26aSAlexander Pyhalov 
168*91e1e26aSAlexander Pyhalov     if (st->last != 0) {
169*91e1e26aSAlexander Pyhalov         tcvn_2_viscii(st->last, &chout);
170*91e1e26aSAlexander Pyhalov         if (**inbuf != 0x0 && chout == 0x0) {
171*91e1e26aSAlexander Pyhalov             unconv++;
172*91e1e26aSAlexander Pyhalov             chout = NON_ID_CHAR;
173*91e1e26aSAlexander Pyhalov         }
174*91e1e26aSAlexander Pyhalov         st->last = 0;
175*91e1e26aSAlexander Pyhalov         *(*outbuf)++ = chout;
176*91e1e26aSAlexander Pyhalov         (*outbytesleft) -= 1;
177*91e1e26aSAlexander Pyhalov     }
178*91e1e26aSAlexander Pyhalov     return ((size_t)unconv);
179*91e1e26aSAlexander Pyhalov 
180*91e1e26aSAlexander Pyhalov }
181*91e1e26aSAlexander Pyhalov 
182*91e1e26aSAlexander Pyhalov /* binsearch: find x in v[0] <= v[1] <= ... <= v[n-1] */
binsearch(unsigned short x,Combine_map_tcvn v[],int n)183*91e1e26aSAlexander Pyhalov static int binsearch(unsigned short x, Combine_map_tcvn v[], int n)
184*91e1e26aSAlexander Pyhalov {
185*91e1e26aSAlexander Pyhalov     int low = 0;
186*91e1e26aSAlexander Pyhalov     int mid = 0;
187*91e1e26aSAlexander Pyhalov     int high = n - 1;
188*91e1e26aSAlexander Pyhalov 
189*91e1e26aSAlexander Pyhalov     low = 0;
190*91e1e26aSAlexander Pyhalov     while (low <= high) {
191*91e1e26aSAlexander Pyhalov         mid = (low + high) / 2;
192*91e1e26aSAlexander Pyhalov         if (x < (unsigned short)v[mid].base)
193*91e1e26aSAlexander Pyhalov             high = mid - 1;
194*91e1e26aSAlexander Pyhalov         else if (x > (unsigned short)v[mid].base)
195*91e1e26aSAlexander Pyhalov             low = mid + 1;
196*91e1e26aSAlexander Pyhalov         else
197*91e1e26aSAlexander Pyhalov             /* found match */
198*91e1e26aSAlexander Pyhalov             return mid;
199*91e1e26aSAlexander Pyhalov     }
200*91e1e26aSAlexander Pyhalov 
201*91e1e26aSAlexander Pyhalov     /* no match */
202*91e1e26aSAlexander Pyhalov     return (-1);
203*91e1e26aSAlexander Pyhalov }
204