xref: /titanic_51/usr/src/lib/libast/common/regex/regsub.c (revision 3e14f97f673e8a630f076077de35afdd43dc1587)
1da2e3ebdSchin /***********************************************************************
2da2e3ebdSchin *                                                                      *
3da2e3ebdSchin *               This software is part of the ast package               *
4*3e14f97fSRoger A. Faulkner *          Copyright (c) 1985-2010 AT&T Intellectual Property          *
5da2e3ebdSchin *                      and is licensed under the                       *
6da2e3ebdSchin *                  Common Public License, Version 1.0                  *
77c2fbfb3SApril Chin *                    by AT&T Intellectual Property                     *
8da2e3ebdSchin *                                                                      *
9da2e3ebdSchin *                A copy of the License is available at                 *
10da2e3ebdSchin *            http://www.opensource.org/licenses/cpl1.0.txt             *
11da2e3ebdSchin *         (with md5 checksum 059e8cd6165cb4c31e351f2b69388fd9)         *
12da2e3ebdSchin *                                                                      *
13da2e3ebdSchin *              Information and Software Systems Research               *
14da2e3ebdSchin *                            AT&T Research                             *
15da2e3ebdSchin *                           Florham Park NJ                            *
16da2e3ebdSchin *                                                                      *
17da2e3ebdSchin *                 Glenn Fowler <gsf@research.att.com>                  *
18da2e3ebdSchin *                  David Korn <dgk@research.att.com>                   *
19da2e3ebdSchin *                   Phong Vo <kpv@research.att.com>                    *
20da2e3ebdSchin *                                                                      *
21da2e3ebdSchin ***********************************************************************/
22da2e3ebdSchin #pragma prototyped
23da2e3ebdSchin 
24da2e3ebdSchin /*
25da2e3ebdSchin  * OBSOLETE Sfio_t buffer interface -- use regsubcomp(),regsubexec()
26da2e3ebdSchin  */
27da2e3ebdSchin 
28da2e3ebdSchin #include "reglib.h"
29da2e3ebdSchin 
30da2e3ebdSchin /*
31da2e3ebdSchin  * do a single substitution
32da2e3ebdSchin  */
33da2e3ebdSchin 
34da2e3ebdSchin static int
subold(register Sfio_t * dp,const char * op,register const char * sp,size_t nmatch,register regmatch_t * match,register regflags_t flags,int sre)35da2e3ebdSchin subold(register Sfio_t* dp, const char* op, register const char* sp, size_t nmatch, register regmatch_t* match, register regflags_t flags, int sre)
36da2e3ebdSchin {
37da2e3ebdSchin 	register int	c;
38da2e3ebdSchin 	char*		s;
39da2e3ebdSchin 	char*		e;
40da2e3ebdSchin 	const char*	b;
41da2e3ebdSchin 	regflags_t	f;
42da2e3ebdSchin 
43da2e3ebdSchin 	f = flags &= (REG_SUB_LOWER|REG_SUB_UPPER);
44da2e3ebdSchin 	for (;;)
45da2e3ebdSchin 	{
46da2e3ebdSchin 		switch (c = *sp++)
47da2e3ebdSchin 		{
48da2e3ebdSchin 		case 0:
49da2e3ebdSchin 			return 0;
50da2e3ebdSchin 		case '~':
51da2e3ebdSchin 			if (!sre || *sp != '(')
52da2e3ebdSchin 			{
53da2e3ebdSchin 				sfputc(dp, c);
54da2e3ebdSchin 				continue;
55da2e3ebdSchin 			}
56da2e3ebdSchin 			b = sp - 1;
57da2e3ebdSchin 			sp++;
58da2e3ebdSchin 			break;
59da2e3ebdSchin 		case '\\':
60da2e3ebdSchin 			if (sre)
61da2e3ebdSchin 			{
62da2e3ebdSchin 				sfputc(dp, chresc(sp - 1, &s));
63da2e3ebdSchin 				sp = (const char*)s;
64da2e3ebdSchin 				continue;
65da2e3ebdSchin 			}
66da2e3ebdSchin 			if (*sp == '&')
67da2e3ebdSchin 			{
68da2e3ebdSchin 				c = *sp++;
69da2e3ebdSchin 				sfputc(dp, c);
70da2e3ebdSchin 				continue;
71da2e3ebdSchin 			}
72da2e3ebdSchin 			break;
73da2e3ebdSchin 		case '&':
74da2e3ebdSchin 			if (sre)
75da2e3ebdSchin 			{
76da2e3ebdSchin 				sfputc(dp, c);
77da2e3ebdSchin 				continue;
78da2e3ebdSchin 			}
79da2e3ebdSchin 			sp--;
80da2e3ebdSchin 			break;
81da2e3ebdSchin 		default:
82da2e3ebdSchin 			switch (flags)
83da2e3ebdSchin 			{
84da2e3ebdSchin 			case REG_SUB_UPPER:
85da2e3ebdSchin 				if (islower(c))
86da2e3ebdSchin 					c = toupper(c);
87da2e3ebdSchin 				break;
88da2e3ebdSchin 			case REG_SUB_LOWER:
89da2e3ebdSchin 				if (isupper(c))
90da2e3ebdSchin 					c = tolower(c);
91da2e3ebdSchin 				break;
92da2e3ebdSchin 			case REG_SUB_UPPER|REG_SUB_LOWER:
93da2e3ebdSchin 				if (isupper(c))
94da2e3ebdSchin 					c = tolower(c);
95da2e3ebdSchin 				else if (islower(c))
96da2e3ebdSchin 					c = toupper(c);
97da2e3ebdSchin 				break;
98da2e3ebdSchin 			}
99da2e3ebdSchin 			sfputc(dp, c);
100da2e3ebdSchin 			continue;
101da2e3ebdSchin 		}
102da2e3ebdSchin 		switch (c = *sp++)
103da2e3ebdSchin 		{
104da2e3ebdSchin 		case 0:
105da2e3ebdSchin 			sp--;
106da2e3ebdSchin 			continue;
107da2e3ebdSchin 		case '&':
108da2e3ebdSchin 			c = 0;
109da2e3ebdSchin 			break;
110da2e3ebdSchin 		case '0': case '1': case '2': case '3': case '4':
111da2e3ebdSchin 		case '5': case '6': case '7': case '8': case '9':
112da2e3ebdSchin 			c -= '0';
113da2e3ebdSchin 			if (sre)
114da2e3ebdSchin 				while (isdigit(*sp))
115da2e3ebdSchin 					c = c * 10 + *sp++ - '0';
116da2e3ebdSchin 			break;
117da2e3ebdSchin 		case 'l':
118da2e3ebdSchin 			if (sre && *sp != ')')
119da2e3ebdSchin 			{
120da2e3ebdSchin 				c = -1;
121da2e3ebdSchin 				break;
122da2e3ebdSchin 			}
123da2e3ebdSchin 			if (c = *sp)
124da2e3ebdSchin 			{
125da2e3ebdSchin 				sp++;
126da2e3ebdSchin 				if (isupper(c))
127da2e3ebdSchin 					c = tolower(c);
128da2e3ebdSchin 				sfputc(dp, c);
129da2e3ebdSchin 			}
130da2e3ebdSchin 			continue;
131da2e3ebdSchin 		case 'u':
132da2e3ebdSchin 			if (sre)
133da2e3ebdSchin 			{
134da2e3ebdSchin 				if (*sp != ')')
135da2e3ebdSchin 				{
136da2e3ebdSchin 					c = -1;
137da2e3ebdSchin 					break;
138da2e3ebdSchin 				}
139da2e3ebdSchin 				sp++;
140da2e3ebdSchin 			}
141da2e3ebdSchin 			if (c = *sp)
142da2e3ebdSchin 			{
143da2e3ebdSchin 				sp++;
144da2e3ebdSchin 				if (islower(c))
145da2e3ebdSchin 					c = toupper(c);
146da2e3ebdSchin 				sfputc(dp, c);
147da2e3ebdSchin 			}
148da2e3ebdSchin 			continue;
149da2e3ebdSchin 		case 'E':
150da2e3ebdSchin 			if (sre)
151da2e3ebdSchin 			{
152da2e3ebdSchin 				if (*sp != ')')
153da2e3ebdSchin 				{
154da2e3ebdSchin 					c = -1;
155da2e3ebdSchin 					break;
156da2e3ebdSchin 				}
157da2e3ebdSchin 				sp++;
158da2e3ebdSchin 			}
159da2e3ebdSchin 			flags = f;
160da2e3ebdSchin 			continue;
161da2e3ebdSchin 		case 'L':
162da2e3ebdSchin 			if (sre)
163da2e3ebdSchin 			{
164da2e3ebdSchin 				if (*sp != ')')
165da2e3ebdSchin 				{
166da2e3ebdSchin 					c = -1;
167da2e3ebdSchin 					break;
168da2e3ebdSchin 				}
169da2e3ebdSchin 				sp++;
170da2e3ebdSchin 			}
171da2e3ebdSchin 			f = flags;
172da2e3ebdSchin 			flags = REG_SUB_LOWER;
173da2e3ebdSchin 			continue;
174da2e3ebdSchin 		case 'U':
175da2e3ebdSchin 			if (sre)
176da2e3ebdSchin 			{
177da2e3ebdSchin 				if (*sp != ')')
178da2e3ebdSchin 				{
179da2e3ebdSchin 					c = -1;
180da2e3ebdSchin 					break;
181da2e3ebdSchin 				}
182da2e3ebdSchin 				sp++;
183da2e3ebdSchin 			}
184da2e3ebdSchin 			f = flags;
185da2e3ebdSchin 			flags = REG_SUB_UPPER;
186da2e3ebdSchin 			continue;
187da2e3ebdSchin 		default:
188da2e3ebdSchin 			if (!sre)
189da2e3ebdSchin 			{
190da2e3ebdSchin 				sfputc(dp, chresc(sp - 2, &s));
191da2e3ebdSchin 				sp = (const char*)s;
192da2e3ebdSchin 				continue;
193da2e3ebdSchin 			}
194da2e3ebdSchin 			sp--;
195da2e3ebdSchin 			c = -1;
196da2e3ebdSchin 			break;
197da2e3ebdSchin 		}
198da2e3ebdSchin 		if (sre)
199da2e3ebdSchin 		{
200da2e3ebdSchin 			if (c < 0 || *sp != ')')
201da2e3ebdSchin 			{
202da2e3ebdSchin 				for (; b < sp; b++)
203da2e3ebdSchin 					sfputc(dp, *b);
204da2e3ebdSchin 				continue;
205da2e3ebdSchin 			}
206da2e3ebdSchin 			sp++;
207da2e3ebdSchin 		}
208da2e3ebdSchin 		if (c >= nmatch)
209da2e3ebdSchin 			return REG_ESUBREG;
210da2e3ebdSchin 		s = (char*)op + match[c].rm_so;
211da2e3ebdSchin 		e = (char*)op + match[c].rm_eo;
212da2e3ebdSchin 		while (s < e)
213da2e3ebdSchin 		{
214da2e3ebdSchin 			c = *s++;
215da2e3ebdSchin 			switch (flags)
216da2e3ebdSchin 			{
217da2e3ebdSchin 			case REG_SUB_UPPER:
218da2e3ebdSchin 				if (islower(c))
219da2e3ebdSchin 					c = toupper(c);
220da2e3ebdSchin 				break;
221da2e3ebdSchin 			case REG_SUB_LOWER:
222da2e3ebdSchin 				if (isupper(c))
223da2e3ebdSchin 					c = tolower(c);
224da2e3ebdSchin 				break;
225da2e3ebdSchin 			case REG_SUB_UPPER|REG_SUB_LOWER:
226da2e3ebdSchin 				if (isupper(c))
227da2e3ebdSchin 					c = tolower(c);
228da2e3ebdSchin 				else if (islower(c))
229da2e3ebdSchin 					c = toupper(c);
230da2e3ebdSchin 				break;
231da2e3ebdSchin 			}
232da2e3ebdSchin 			sfputc(dp, c);
233da2e3ebdSchin 		}
234da2e3ebdSchin 	}
235da2e3ebdSchin }
236da2e3ebdSchin 
237da2e3ebdSchin /*
238da2e3ebdSchin  * ed(1) style substitute using matches from last regexec()
239da2e3ebdSchin  */
240da2e3ebdSchin 
241da2e3ebdSchin int
regsub(const regex_t * p,Sfio_t * dp,const char * op,const char * sp,size_t nmatch,regmatch_t * match,regflags_t flags)242da2e3ebdSchin regsub(const regex_t* p, Sfio_t* dp, const char* op, const char* sp, size_t nmatch, regmatch_t* match, regflags_t flags)
243da2e3ebdSchin {
244da2e3ebdSchin 	int	m;
245da2e3ebdSchin 	int	r;
246da2e3ebdSchin 	int	sre;
247da2e3ebdSchin 
248da2e3ebdSchin 	if ((p->env->flags & REG_NOSUB) || !nmatch)
249da2e3ebdSchin 		return fatal(p->env->disc, REG_BADPAT, NiL);
250da2e3ebdSchin 	m = (flags >> 16) & 0x3fff;
251da2e3ebdSchin 	sre = !!(p->env->flags & REG_SHELL);
2527c2fbfb3SApril Chin 	r = 0;
253da2e3ebdSchin 	do
254da2e3ebdSchin 	{
255da2e3ebdSchin 		if (--m > 0)
256da2e3ebdSchin 			sfwrite(dp, op, match->rm_eo);
257da2e3ebdSchin 		else
258da2e3ebdSchin 		{
259da2e3ebdSchin 			sfwrite(dp, op, match->rm_so);
260da2e3ebdSchin 			if (r = subold(dp, op, sp, nmatch, match, flags, sre))
261da2e3ebdSchin 				return fatal(p->env->disc, r, NiL);
262da2e3ebdSchin 		}
263da2e3ebdSchin 		op += match->rm_eo;
264da2e3ebdSchin 	} while ((m > 0 || (flags & REG_SUB_ALL)) && !(r = regexec(p, op, nmatch, match, p->env->flags|(match->rm_so == match->rm_eo ? REG_ADVANCE : 0))));
265da2e3ebdSchin 	if (r && r != REG_NOMATCH)
266da2e3ebdSchin 		return fatal(p->env->disc, r, NiL);
267da2e3ebdSchin 	sfputr(dp, op, -1);
268da2e3ebdSchin 	return 0;
269da2e3ebdSchin }
270