xref: /freebsd/bin/ed/sub.c (revision 0fd510b71aa44308681d2e01c9d772f32af24313)
195e6217eSAndrew Moore /* sub.c: This file contains the substitution routines for the ed
295e6217eSAndrew Moore    line editor */
395e6217eSAndrew Moore /*-
495e6217eSAndrew Moore  * Copyright (c) 1993 Andrew Moore, Talke Studio.
595e6217eSAndrew Moore  * All rights reserved.
695e6217eSAndrew Moore  *
795e6217eSAndrew Moore  * Redistribution and use in source and binary forms, with or without
895e6217eSAndrew Moore  * modification, are permitted provided that the following conditions
995e6217eSAndrew Moore  * are met:
1095e6217eSAndrew Moore  * 1. Redistributions of source code must retain the above copyright
1195e6217eSAndrew Moore  *    notice, this list of conditions and the following disclaimer.
1295e6217eSAndrew Moore  * 2. Redistributions in binary form must reproduce the above copyright
1395e6217eSAndrew Moore  *    notice, this list of conditions and the following disclaimer in the
1495e6217eSAndrew Moore  *    documentation and/or other materials provided with the distribution.
1595e6217eSAndrew Moore  *
1695e6217eSAndrew Moore  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
1795e6217eSAndrew Moore  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
1895e6217eSAndrew Moore  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
1995e6217eSAndrew Moore  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
2095e6217eSAndrew Moore  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
2195e6217eSAndrew Moore  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
2295e6217eSAndrew Moore  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
2395e6217eSAndrew Moore  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
2495e6217eSAndrew Moore  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
2595e6217eSAndrew Moore  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
2695e6217eSAndrew Moore  * SUCH DAMAGE.
2789730b29SDavid Greenman  *
280fd510b7SJoerg Wunsch  *	$Id: sub.c,v 1.4 1995/01/14 11:47:16 alm Exp $
2995e6217eSAndrew Moore  */
3095e6217eSAndrew Moore 
3195e6217eSAndrew Moore #ifndef lint
32d165d4acSAndrew Moore static char *rcsid = "@(#)sub.c,v 1.1 1994/02/01 00:34:44 alm Exp";
3395e6217eSAndrew Moore #endif /* not lint */
3495e6217eSAndrew Moore 
3595e6217eSAndrew Moore #include "ed.h"
3695e6217eSAndrew Moore 
3795e6217eSAndrew Moore 
3895e6217eSAndrew Moore char *rhbuf;			/* rhs substitution buffer */
3995e6217eSAndrew Moore int rhbufsz;			/* rhs substitution buffer size */
4095e6217eSAndrew Moore int rhbufi;			/* rhs substitution buffer index */
4195e6217eSAndrew Moore 
4295e6217eSAndrew Moore /* extract_subst_tail: extract substitution tail from the command buffer */
4395e6217eSAndrew Moore int
4495e6217eSAndrew Moore extract_subst_tail(flagp, np)
4595e6217eSAndrew Moore 	int *flagp;
4695e6217eSAndrew Moore 	int *np;
4795e6217eSAndrew Moore {
4895e6217eSAndrew Moore 	char delimiter;
4995e6217eSAndrew Moore 
5095e6217eSAndrew Moore 	*flagp = *np = 0;
5195e6217eSAndrew Moore 	if ((delimiter = *ibufp) == '\n') {
5295e6217eSAndrew Moore 		rhbufi = 0;
5395e6217eSAndrew Moore 		*flagp = GPR;
5495e6217eSAndrew Moore 		return 0;
5595e6217eSAndrew Moore 	} else if (extract_subst_template() == NULL)
5695e6217eSAndrew Moore 		return  ERR;
5795e6217eSAndrew Moore 	else if (*ibufp == '\n') {
5895e6217eSAndrew Moore 		*flagp = GPR;
5995e6217eSAndrew Moore 		return 0;
6095e6217eSAndrew Moore 	} else if (*ibufp == delimiter)
6195e6217eSAndrew Moore 		ibufp++;
6295e6217eSAndrew Moore 	if ('1' <= *ibufp && *ibufp <= '9') {
6395e6217eSAndrew Moore 		STRTOL(*np, ibufp);
6495e6217eSAndrew Moore 		return 0;
6595e6217eSAndrew Moore 	} else if (*ibufp == 'g') {
6695e6217eSAndrew Moore 		ibufp++;
6795e6217eSAndrew Moore 		*flagp = GSG;
6895e6217eSAndrew Moore 		return 0;
6995e6217eSAndrew Moore 	}
7095e6217eSAndrew Moore 	return 0;
7195e6217eSAndrew Moore }
7295e6217eSAndrew Moore 
7395e6217eSAndrew Moore 
7495e6217eSAndrew Moore /* extract_subst_template: return pointer to copy of substitution template
7595e6217eSAndrew Moore    in the command buffer */
7695e6217eSAndrew Moore char *
7795e6217eSAndrew Moore extract_subst_template()
7895e6217eSAndrew Moore {
7995e6217eSAndrew Moore 	int n = 0;
8095e6217eSAndrew Moore 	int i = 0;
8195e6217eSAndrew Moore 	char c;
8295e6217eSAndrew Moore 	char delimiter = *ibufp++;
8395e6217eSAndrew Moore 
8495e6217eSAndrew Moore 	if (*ibufp == '%' && *(ibufp + 1) == delimiter) {
8595e6217eSAndrew Moore 		ibufp++;
8695e6217eSAndrew Moore 		if (!rhbuf) sprintf(errmsg, "no previous substitution");
8795e6217eSAndrew Moore 		return rhbuf;
8895e6217eSAndrew Moore 	}
8995e6217eSAndrew Moore 	while (*ibufp != delimiter) {
9095e6217eSAndrew Moore 		REALLOC(rhbuf, rhbufsz, i + 2, NULL);
9195e6217eSAndrew Moore 		if ((c = rhbuf[i++] = *ibufp++) == '\n' && *ibufp == '\0') {
9295e6217eSAndrew Moore 			i--, ibufp--;
9395e6217eSAndrew Moore 			break;
9495e6217eSAndrew Moore 		} else if (c != '\\')
9595e6217eSAndrew Moore 			;
9695e6217eSAndrew Moore 		else if ((rhbuf[i++] = *ibufp++) != '\n')
9795e6217eSAndrew Moore 			;
9895e6217eSAndrew Moore 		else if (!isglobal) {
9995e6217eSAndrew Moore 			while ((n = get_tty_line()) == 0 ||
1000fd510b7SJoerg Wunsch 			    (n > 0 && ibuf[n - 1] != '\n'))
10195e6217eSAndrew Moore 				clearerr(stdin);
10295e6217eSAndrew Moore 			if (n < 0)
10395e6217eSAndrew Moore 				return NULL;
10495e6217eSAndrew Moore 		}
10595e6217eSAndrew Moore 	}
10695e6217eSAndrew Moore 	REALLOC(rhbuf, rhbufsz, i + 1, NULL);
10795e6217eSAndrew Moore 	rhbuf[rhbufi = i] = '\0';
10895e6217eSAndrew Moore 	return  rhbuf;
10995e6217eSAndrew Moore }
11095e6217eSAndrew Moore 
11195e6217eSAndrew Moore 
11295e6217eSAndrew Moore char *rbuf;			/* substitute_matching_text buffer */
11395e6217eSAndrew Moore int rbufsz;			/* substitute_matching_text buffer size */
11495e6217eSAndrew Moore 
11595e6217eSAndrew Moore /* search_and_replace: for each line in a range, change text matching a pattern
11695e6217eSAndrew Moore    according to a substitution template; return status  */
11795e6217eSAndrew Moore int
11895e6217eSAndrew Moore search_and_replace(pat, gflag, kth)
11995e6217eSAndrew Moore 	pattern_t *pat;
12095e6217eSAndrew Moore 	int gflag;
12195e6217eSAndrew Moore 	int kth;
12295e6217eSAndrew Moore {
12395e6217eSAndrew Moore 	undo_t *up;
12495e6217eSAndrew Moore 	char *txt;
12595e6217eSAndrew Moore 	char *eot;
12695e6217eSAndrew Moore 	long lc;
127c7230830SAndrew Moore 	long xa = current_addr;
12895e6217eSAndrew Moore 	int nsubs = 0;
12995e6217eSAndrew Moore 	line_t *lp;
13095e6217eSAndrew Moore 	int len;
13195e6217eSAndrew Moore 
13295e6217eSAndrew Moore 	current_addr = first_addr - 1;
13395e6217eSAndrew Moore 	for (lc = 0; lc <= second_addr - first_addr; lc++) {
13495e6217eSAndrew Moore 		lp = get_addressed_line_node(++current_addr);
13595e6217eSAndrew Moore 		if ((len = substitute_matching_text(pat, lp, gflag, kth)) < 0)
13695e6217eSAndrew Moore 			return ERR;
13795e6217eSAndrew Moore 		else if (len) {
13895e6217eSAndrew Moore 			up = NULL;
13995e6217eSAndrew Moore 			if (delete_lines(current_addr, current_addr) < 0)
14095e6217eSAndrew Moore 				return ERR;
14195e6217eSAndrew Moore 			txt = rbuf;
14295e6217eSAndrew Moore 			eot = rbuf + len;
14395e6217eSAndrew Moore 			SPL1();
14495e6217eSAndrew Moore 			do {
14595e6217eSAndrew Moore 				if ((txt = put_sbuf_line(txt)) == NULL) {
14695e6217eSAndrew Moore 					SPL0();
14795e6217eSAndrew Moore 					return ERR;
14895e6217eSAndrew Moore 				} else if (up)
14995e6217eSAndrew Moore 					up->t = get_addressed_line_node(current_addr);
15095e6217eSAndrew Moore 				else if ((up = push_undo_stack(UADD,
15195e6217eSAndrew Moore 				    current_addr, current_addr)) == NULL) {
15295e6217eSAndrew Moore 					SPL0();
15395e6217eSAndrew Moore 					return ERR;
15495e6217eSAndrew Moore 				}
15595e6217eSAndrew Moore 			} while (txt != eot);
15695e6217eSAndrew Moore 			SPL0();
15795e6217eSAndrew Moore 			nsubs++;
158c7230830SAndrew Moore 			xa = current_addr;
15995e6217eSAndrew Moore 		}
16095e6217eSAndrew Moore 	}
161c7230830SAndrew Moore 	current_addr = xa;
16295e6217eSAndrew Moore 	if  (nsubs == 0 && !(gflag & GLB)) {
16395e6217eSAndrew Moore 		sprintf(errmsg, "no match");
16495e6217eSAndrew Moore 		return ERR;
16595e6217eSAndrew Moore 	} else if ((gflag & (GPR | GLS | GNP)) &&
16695e6217eSAndrew Moore 	    display_lines(current_addr, current_addr, gflag) < 0)
16795e6217eSAndrew Moore 		return ERR;
16895e6217eSAndrew Moore 	return 0;
16995e6217eSAndrew Moore }
17095e6217eSAndrew Moore 
17195e6217eSAndrew Moore 
17295e6217eSAndrew Moore /* substitute_matching_text: replace text matched by a pattern according to
17395e6217eSAndrew Moore    a substitution template; return pointer to the modified text */
17495e6217eSAndrew Moore int
17595e6217eSAndrew Moore substitute_matching_text(pat, lp, gflag, kth)
17695e6217eSAndrew Moore 	pattern_t *pat;
17795e6217eSAndrew Moore 	line_t *lp;
17895e6217eSAndrew Moore 	int gflag;
17995e6217eSAndrew Moore 	int kth;
18095e6217eSAndrew Moore {
18195e6217eSAndrew Moore 	int off = 0;
18295e6217eSAndrew Moore 	int changed = 0;
18395e6217eSAndrew Moore 	int matchno = 0;
18495e6217eSAndrew Moore 	int i = 0;
18595e6217eSAndrew Moore 	regmatch_t rm[SE_MAX];
18695e6217eSAndrew Moore 	char *txt;
18795e6217eSAndrew Moore 	char *eot;
18895e6217eSAndrew Moore 
18995e6217eSAndrew Moore 	if ((txt = get_sbuf_line(lp)) == NULL)
19095e6217eSAndrew Moore 		return ERR;
19195e6217eSAndrew Moore 	if (isbinary)
19295e6217eSAndrew Moore 		NUL_TO_NEWLINE(txt, lp->len);
19395e6217eSAndrew Moore 	eot = txt + lp->len;
19495e6217eSAndrew Moore 	if (!regexec(pat, txt, SE_MAX, rm, 0)) {
19595e6217eSAndrew Moore 		do {
19695e6217eSAndrew Moore 			if (!kth || kth == ++matchno) {
19795e6217eSAndrew Moore 				changed++;
19895e6217eSAndrew Moore 				i = rm[0].rm_so;
19995e6217eSAndrew Moore 				REALLOC(rbuf, rbufsz, off + i, ERR);
20095e6217eSAndrew Moore 				if (isbinary)
20195e6217eSAndrew Moore 					NEWLINE_TO_NUL(txt, rm[0].rm_eo);
20295e6217eSAndrew Moore 				memcpy(rbuf + off, txt, i);
20395e6217eSAndrew Moore 				off += i;
20495e6217eSAndrew Moore 				if ((off = apply_subst_template(txt, rm, off,
20595e6217eSAndrew Moore 				    pat->re_nsub)) < 0)
20695e6217eSAndrew Moore 					return ERR;
20795e6217eSAndrew Moore 			} else {
20895e6217eSAndrew Moore 				i = rm[0].rm_eo;
20995e6217eSAndrew Moore 				REALLOC(rbuf, rbufsz, off + i, ERR);
21095e6217eSAndrew Moore 				if (isbinary)
21195e6217eSAndrew Moore 					NEWLINE_TO_NUL(txt, i);
21295e6217eSAndrew Moore 				memcpy(rbuf + off, txt, i);
21395e6217eSAndrew Moore 				off += i;
21495e6217eSAndrew Moore 			}
21595e6217eSAndrew Moore 			txt += rm[0].rm_eo;
2160fd510b7SJoerg Wunsch 		} while (*txt &&
2170fd510b7SJoerg Wunsch                         (!changed || ((gflag & GSG) && rm[0].rm_eo)) &&
21895e6217eSAndrew Moore 		        !regexec(pat, txt, SE_MAX, rm, REG_NOTBOL));
21995e6217eSAndrew Moore 		i = eot - txt;
22095e6217eSAndrew Moore 		REALLOC(rbuf, rbufsz, off + i + 2, ERR);
22195e6217eSAndrew Moore 		if (i > 0 && !rm[0].rm_eo && (gflag & GSG)) {
22295e6217eSAndrew Moore 			sprintf(errmsg, "infinite substitution loop");
22395e6217eSAndrew Moore 			return  ERR;
22495e6217eSAndrew Moore 		}
22595e6217eSAndrew Moore 		if (isbinary)
22695e6217eSAndrew Moore 			NEWLINE_TO_NUL(txt, i);
22795e6217eSAndrew Moore 		memcpy(rbuf + off, txt, i);
22895e6217eSAndrew Moore 		memcpy(rbuf + off + i, "\n", 2);
22995e6217eSAndrew Moore 	}
23095e6217eSAndrew Moore 	return changed ? off + i + 1 : 0;
23195e6217eSAndrew Moore }
23295e6217eSAndrew Moore 
23395e6217eSAndrew Moore 
23495e6217eSAndrew Moore /* apply_subst_template: modify text according to a substitution template;
23595e6217eSAndrew Moore    return offset to end of modified text */
23695e6217eSAndrew Moore int
23795e6217eSAndrew Moore apply_subst_template(boln, rm, off, re_nsub)
23895e6217eSAndrew Moore 	char *boln;
23995e6217eSAndrew Moore 	regmatch_t *rm;
24095e6217eSAndrew Moore 	int off;
24195e6217eSAndrew Moore 	int re_nsub;
24295e6217eSAndrew Moore {
24395e6217eSAndrew Moore 	int j = 0;
24495e6217eSAndrew Moore 	int k = 0;
24595e6217eSAndrew Moore 	int n;
24695e6217eSAndrew Moore 	char *sub = rhbuf;
24795e6217eSAndrew Moore 
24895e6217eSAndrew Moore 	for (; sub - rhbuf < rhbufi; sub++)
24995e6217eSAndrew Moore 		if (*sub == '&') {
25095e6217eSAndrew Moore 			j = rm[0].rm_so;
25195e6217eSAndrew Moore 			k = rm[0].rm_eo;
25295e6217eSAndrew Moore 			REALLOC(rbuf, rbufsz, off + k - j, ERR);
25395e6217eSAndrew Moore 			while (j < k)
25495e6217eSAndrew Moore 				rbuf[off++] = boln[j++];
25595e6217eSAndrew Moore 		} else if (*sub == '\\' && '1' <= *++sub && *sub <= '9' &&
25695e6217eSAndrew Moore 		    (n = *sub - '0') <= re_nsub) {
25795e6217eSAndrew Moore 			j = rm[n].rm_so;
25895e6217eSAndrew Moore 			k = rm[n].rm_eo;
25995e6217eSAndrew Moore 			REALLOC(rbuf, rbufsz, off + k - j, ERR);
26095e6217eSAndrew Moore 			while (j < k)
26195e6217eSAndrew Moore 				rbuf[off++] = boln[j++];
26295e6217eSAndrew Moore 		} else {
26395e6217eSAndrew Moore 			REALLOC(rbuf, rbufsz, off + 1, ERR);
26495e6217eSAndrew Moore 			rbuf[off++] = *sub;
26595e6217eSAndrew Moore 		}
26695e6217eSAndrew Moore 	REALLOC(rbuf, rbufsz, off + 1, ERR);
26795e6217eSAndrew Moore 	rbuf[off] = '\0';
26895e6217eSAndrew Moore 	return off;
26995e6217eSAndrew Moore }
270